前言
随着互联网的飞速发展,人们在互联网上的行为产生了海量数据,对这些数据的存储、处理与分析带动了大数据技术的发展。其中,数据分析与可视化技术可以帮助人们在庞大的数据之间进行相关分析,找到有价值的信息和规律,使得人们对世界的认识更快、更便捷。在数据科学领域,Python语言由于简单易用、第三方库强大的特点,深受数据分析人员的青睐。
因此,本书从Python数据分析的基础知识入手,结合大量的数据分析示例,系统地介绍了数据分析和可视化的原理与方法,带领读者逐步掌握Python数据分析的相关知识,提高解决实际问题的能力。
本书特色
(1) 内容全面,讲解系统。
(2) 给出了数据分析环境的安装和配置步骤。
(3) 详细介绍了利用Python进行数据分析与可视化的方法。
(4) 提供了多个有较高应用价值的项目案例,有很强的实用性。
(5) 配套资源丰富,方便教学和学习。
本书内容
第1章数据分析与可视化概述,主要介绍数据分析与可视化的基本内容、数据分析与数据挖掘的关系、数据分析与可视化常用的工具、Python数据分析与可视化的主要库、Jupyter Notebook的安装以及基本使用方法。
第2章Python编程基础,主要介绍Python语言的基本语法、内置数据类型、函数以及文件操作。
第3章NumPy数值计算基础,主要介绍数组及其索引、数组运算、数组读写及常用的统计与分析方法。 
第4章Pandas统计分析基础,主要介绍Pandas中的数据结构、索引操作、数据查询与编辑、分组汇总聚合、透视表以及Pandas的简单绘图。 
第5章Pandas数据载入与预处理,主要针对数据预处理阶段的需求,介绍使用Pandas载入数据、合并数据、数据清洗、数据标准化及数据转换的典型方法。
第6章Matplotlib数据可视化基础,主要介绍Pyplot绘图的基本语法、常用参数设置和各类常用图形的绘制。
第7章Seaborn可视化,主要介绍Seaborn可视化中的风格与主题设置及常见绘图的基本用法。
第8章pyecharts可视化,主要介绍pyecharts的安装与导入,绘图的主要过程以及柱状图、饼图、K线图、仪表盘、词云、平行坐标图、桑基图、地图及组合图表的绘制方法。
第9章时间序列数据分析,主要介绍时间序列数据分析的基本方法,包括Pandas中日期型数据,日期的范围、频率,时期的操作以及平稳序列的基本检验方法。
第10章SciPy科学计算,主要介绍SciPy中的常数和特殊函数、线性代数运算、优化、稀疏矩阵处理、简单的图像处理及信号处理等内容。
第11章统计与机器学习,主要介绍Scikitlearn库的主要功能、典型的回归分析、分类、聚类算法以及主成分分析方法。
第12章图像数据分析,主要介绍OpenCV的导入、图像的基本操作、SIFT和SURF特征点的提取及图像的降噪。
第13章综合案例,介绍了三个综合案例,针对职业人群体检数据、股票数据和红酒数据,结合前面章节介绍的数据分析和数据可视化技术,进行数据分析。
与第1版相比,第2版有如下调整: 
 对数据分析与可视化内容强化了理论讲解与系统性说明; 
 补充了Jupyter Notebook的安装、Pandas数据查询、Pandas数据库文件和JSON数据读取、时间序列的平稳性检验、SciPy中的信号处理以及回归分析等内容; 
 优化了部分示例代码,补充了雷达图、流向图、平行坐标图、极坐标图、关系类图、热力图和地图等绘图方法; 
 增加了数据分析案例与各章习题。

本书配套资源
 教学大纲、教学课件、电子教案、程序源码、在线教程、教学进度表。
 600分钟的视频讲解。

资源下载提示
课件等资源: 扫描封底的“课件下载”二维码,在公众号“书圈”下载。
素材(源码)等资源: 扫描目录上方的二维码下载。
在线作业: 扫描封底作业系统二维码,登录网站在线做题及查看答案。
视频等资源: 扫描封底刮刮卡中的二维码,再扫描书中相应章节中的二维码,可以在线学习。
本书由魏伟一、李晓红和高志玲共同编写。
由于作者水平有限,书中难免存在疏漏和不足之处,敬请读者批评指正。






编者2021年3月