前言 随着互联网技术与应用的飞速发展,互联网上产生的数据已经成为与其他资源同等重要的基础生产要素,互联网数据的存储、处理与分析推动了大数据技术的发展。其中,数据的分析与挖掘技术可以帮助人们从海量的数据中找出有价值的信息和规律。在数据分析领域,由于Python语言简单,易学易用,且具有丰富和成熟的扩展库,因而近年来Python语言深受数据分析人员的青睐。因此,本书从Python语言与数据分析基础知识入手,并结合大量的实例,带领学习者一步步地掌握Python数据分析的相关知识,并提高解决实际问题的能力。 本书基于Python 3.8和Anaconda 3,以“理论够用、重在实践”为目标,注重理论与实践相结合,通过引用大量的实例,由浅入深、循序渐进地介绍了Python语言与数据分析可视化的基础知识和应用。 本书共有9章,其内容如下。 第1章主要讲解 Python语言、数据分析与可视化概述、Python开发环境及工具和任务实现。 第2章主要讲解Python程序编写风格、变量、Python数据类型、Python运算符与表达式、Python常用函数和任务实现。 第3章主要讲解Python的列表、元组、字典、集合和任务实现。 第4章主要讲解Python的顺序控制语句、if选择语句、循环语句、异常处理和任务实现。 第5章主要讲解函数概述、函数的声明和调用、参数的传递、函数返回值、变量的作用域、模块和任务实现。 第6章主要讲解Numpy库与Pandas库,包括ndarray对象、Numpy常用函数、Numpy数组运算、Numpy数组排序、Numpy生成随机数模块、Numpy中的数据去重与重复、Numpy中的数学函数与统计函数,以及Pandas数据类型、Pandas数据运算、Pandas数据排序、Pandas常用计算函数、Pandas数据可视化、Pandas读写文件数据和任务实现。 第7章主要讲解Pandas数据清洗、数据合并、数据重塑、数据转换和任务实现。 第8章主要讲解Matplotlib库简介与绘图基础,Seaborn库简介与常用方法及Seaborn库中的常用绘图函数,词云库wordcloud和stylecloud,以及pyecharts库简介和配置项、pyecharts图表渲染方法、pyecharts常用图表绘制函数和任务实现。 第9章主要讲解时间序列的基本操作,时期周期与计算,重采样、降采样和升采样,滑动窗口与统计和任务实现。 本书由骆焦煌编著。本书的出版得到教育部高等教育司2021年第二批产学合作协同育人项目(课题编号: 202102186004)的资助。 本书在编写时参阅了大量的书籍,在此表示感谢。 由于编著者水平有限,书中难免有不足之处,敬请广大同行和读者批评、指正。 编著者2022年10月