前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
编程与工具

Python数据可视化:核心编程基础回顾与应用

NEXTECH
Last updated: 2025年10月26日 上午5:48
By NEXTECH
Share
22 Min Read
SHARE

本数据可视化系列文章,迄今已探讨了可视化设计的核心基础要素。在实际设计和构建可视化之前,理解这些原则至关重要,它们能确保底层数据得到公正而准确的呈现。建议读者查阅此系列前几篇文章(链接如上),以建立全面的理解:

Contents
编程基础:表达式、变量与函数Python与数据可视化参考文献
  • 第一部分:“数据可视化深度解析:它是什么以及为何重要”
  • 第二部分:“数据可视化深度解析:视觉变量简介”
  • 第三部分:“数据可视化深度解析:色彩的作用”

现在,读者已准备好开始构建自己的可视化作品。未来的文章将涵盖多种构建方式——本着数据科学的精神,其中许多方法都将涉及编程。为了确保读者为此下一步做好准备,本文将简要回顾Python编程的核心要素,并讨论它们与数据可视化编码的相关性。

编程基础:表达式、变量与函数

表达式、变量和函数是所有Python代码(乃至任何编程语言代码)的主要构建块。接下来,将深入探讨它们的工作原理。

表达式

一个表达式是一个计算后能得到某个值的语句。最简单的表达式是任何类型的常量值。例如,以下是三个简单的表达式:第一个是整数,第二个是字符串,第三个是浮点数。

7
'7'
7.0

更复杂的表达式通常包含数学运算。可以对各种数字进行加、减、乘、除等操作:

3 + 7
820 - 300
7 * 53
121 / 11
6 + 13 - 3 * 4

根据定义,Python会遵循PEMDAS(括号、指数、乘法、除法、加法、减法)的数学运算顺序 [1] 将这些表达式评估为一个单一值。例如,上面最后一个表达式的计算结果为7.0。(读者知道为什么吗?)

You Might Also Like

提升数据科学项目效率:概念框架的四种类型与构建技巧
2026年数据科学:依然是明智的职业选择吗?
构建多页仪表盘:Plotly Dash 分层项目框架实战指南
Python 性能优化终极指南:如何集成 C 语言实现高达 150 倍的速度飞跃

变量

表达式本身虽然强大,但单独使用并不总是非常有用。在编程中,通常需要保存某些表达式的值,以便在程序的后续部分使用它们。变量是一个容器,用于存储表达式的值,并允许在稍后访问它。以下是与第一个示例完全相同的表达式,但这次它们的值被保存到不同的变量中:

int_seven = 7
text_seven = '7'
float_seven = 7.0

Python中的变量具有几个重要的特性:

  • 变量的名称(等号左侧的词)必须是一个单词,且不能以数字开头。如果变量名需要包含多个单词,约定俗成的做法是用下划线分隔它们(如上例所示)。
  • 在Python中处理变量时,无需像其他编程语言那样指定数据类型。这是因为Python是一种动态类型语言。
  • 一些其他编程语言区分变量的声明和赋值。在Python中,声明变量和赋值在同一行完成,因此不需要区分两者。

当变量被声明时,Python会始终先将等号右侧的表达式评估为一个单一值,然后再将其赋值给变量。(这与Python评估复杂表达式的方式密切相关)。例如:

yet_another_seven = (2 * 2) + (9 / 3)
上面的变量被赋值为7.0,而不是复合表达式(2 * 2) + (9 / 3)本身。

函数

函数可以被看作是一种机器。它接受一个(或多个)输入,运行一些代码来转换传入的对象,并输出一个确切的值。在Python中,函数主要用于两个目的:

  1. 处理感兴趣的输入变量并得出所需输出(类似于数学函数)。
  2. 避免代码重复。通过将代码封装在函数内部,每当需要运行该代码时,只需调用函数即可(而不是一遍又一遍地编写相同的代码)。

理解如何在Python中定义函数的最简单方法是查看示例。下面,编写了一个简单的函数,它将一个数字的值翻倍:

def double(num):
    doubled_value = num * 2
    return doubled_value

print(double(2))    # outputs 4
print(double(4))    # outputs 8

关于以上示例,有一些重要的点需要确保理解:

  • def关键字告诉Python正在定义一个函数。def后面直接跟着的词是函数的名称,因此上面的函数名为double。
  • 函数名之后是一对括号,括号内部放置函数的参数(一个花哨的术语,表示函数的输入)。重要提示:如果函数不需要任何参数,仍然需要包含括号——只是不要在其中放入任何内容。
  • def语句的末尾必须使用冒号,否则Python会报错。整个def语句所在的行被称为函数签名。
  • def语句之后的所有行都包含构成函数的代码,并向内缩进一个层级。这些行共同构成了函数体。
  • 函数中的最后一行是return语句,它使用return关键字指定函数的输出。return语句不一定非得是函数的最后一行,但一旦遇到它,Python就会退出函数,后续代码行将不再运行。更复杂的函数可能包含多个return语句。
  • 通过编写函数名并在括号中放入所需的输入来调用函数。如果调用没有输入的函数,仍然需要包含括号。

Python与数据可视化

现在,来回答可能一直在思考的问题:为什么要先回顾Python呢?毕竟,可视化数据的方法有很多种,它们肯定不都受限于Python知识,甚至不都受限于编程知识。

这确实是事实,但作为一名数据科学家,很可能需要在某个时候进行编程——而在编程领域,最常使用的语言极有可能是Python。当团队中的数据工程师交付数据清洗和分析管道时,如果能快速有效地将其转化为一系列可操作、可展示的视觉洞察,那将非常有价值。

总的来说,了解Python对于数据可视化至关重要,原因有以下几点:

  • 它是一种易于上手的语言。如果读者刚转型到数据科学和可视化工作,使用Python编程可视化图表会比使用JavaScript中的D3等更底层的工具容易得多。

  • Python拥有许多不同且流行的库,它们都能够利用上述学习到的Python基础知识来可视化数据。例如Matplotlib、Seaborn、Plotly和Vega-Altair(以前简称Altair)。未来的文章将探讨其中一些工具,特别是Altair。

  • 此外,上述库都能与Python中基础的数据科学库pandas无缝集成。pandas中的数据可以直接融入这些库的代码逻辑来构建可视化图表;通常甚至不需要导出或转换数据,就可以开始进行可视化。

  • 本文讨论的基本原则看似初级,但它们对于实现数据可视化大有裨益:

    • 正确计算表达式并理解他人编写的表达式,对于确保可视化准确表示数据至关重要。

    • 通常需要存储特定值或一组值,以便稍后整合到可视化中——这时就需要变量。

      • 有时,甚至可以将整个可视化存储在变量中,以便后续使用或展示。
    • Plotly和Altair等更高级的库允许调用内置(有时甚至是用户定义)函数来自定义可视化。

    • 基本的Python知识将使读者能够使用Plotly Dash和Streamlit等工具,将可视化集成到可以与他人共享的简单应用程序中。这些工具旨在简化初级编程者构建应用程序的过程,而本文涵盖的基础概念足以让读者开始使用它们。

如果这些理由还不足以说服读者,建议点击上面任意一个链接,开始亲自探索这些可视化工具。一旦看到它们能做什么,就会爱不释手。

至于后续内容,将在下一篇文章中带来构建可视化的教程。(其中一个或多个工具可能会出现)。敬请期待!

参考文献

TAGGED:Python编程数据可视化数据科学编程基础
Share This Article
Email Copy Link Print
Previous Article 20251025130143931.jpg “AI将取代所有工作”:马斯克预言,亚马逊加速自动化引发未来思辨
Next Article 使用Unity Catalog和Databricks中的开源工具构建的地理空间分析工作流概述 利用开源工具和Databricks构建地理空间数据湖仓:从数据摄取到智能分析
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

编程与工具

Python 代码测试利器:Hypothesis 基于属性测试,先于用户发现潜在缺陷

2025年11月1日
一个在PyBullet中创建的立方体可视化效果
编程与工具

Python机器人入门指南:使用PyBullet轻松构建3D仿真

2025年10月17日
图1:SoftCo公司销售业绩散点图
数据科学与工程

数据科学家必读:概念框架维度的力量,解锁深层数据洞察

2025年10月27日
数据科学与工程

数据讲故事:赋能商业决策与数据分析师的关键技能

2025年11月11日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up