目录



第1章数据分析概述00

1.1什么是数据分析00

1.1.1数据的类型00

1.1.2数据分析的过程00

1.1.3与数据分析相关的概念00

1.2为何用Python进行数据分析00

1.2.1Python语言的特点00

1.2.2Python在数据分析方面的优势00

1.3重要的Python库00

1.3.1NumPy00

1.3.2SciPy00

1.3.3Pandas00

1.3.4Matplotlib00

1.3.5pyecharts00

1.3.6StatsModels00

1.3.7scikitlearn00

1.4Anaconda的安装和使用00

1.4.1Anaconda的下载00

1.4.2Anaconda的安装00

1.4.3安装和更新Python包00

1.5Jupyter Notebook的使用0

1.5.1打开Jupyter Notebook0

1.5.2Jupyter Notebook中代码的编辑与运行0

1.6本章小结0


第2章Python程序设计基础0

2.1Python语言基础0

2.1.1对象、变量和标识符0

2.1.2内置数据类型0

2.1.3运算符和表达式0

2.1.4Python中的函数和模块0

2.2流程控制0

2.2.1顺序结构0

2.2.2选择结构0

2.2.3循环结构0

2.3Python组合数据类型0

2.3.1列表0

2.3.2元组0

2.3.3字符串0

2.3.4字典0

2.4函数0

2.4.1函数的定义和调用0

2.4.2函数参数和返回值0

2.4.3lambda表达式0

2.4.4递归函数0

2.4.5函数式编程和高阶函数0

2.5本章小结0


第3章NumPy基础0

3.1多维数组对象ndarray0

3.1.1ndarray对象的创建0

3.1.2ndarray对象的属性0

3.1.3随机数数组0

3.2数组的基本操作0

3.2.1数组的索引和切片0

3.2.2数组形状变换0

3.2.3数组转置和轴对换0

3.2.4数组的合并与拆分0

3.3数组的运算0

3.3.1数组运算和广播机制0

3.3.2数组的排序0

3.3.3统计运算0

3.3.4线性代数运算0

3.4一个有趣的数组应用实例0

3.5本章小结0








第4章Pandas数据分析0

4.1Pandas数据结构及创建0

4.1.1Pandas数据结构概述0

4.1.2创建Series数据结构0

4.1.3创建DataFrame数据结构0

4.2DataFrame基本操作0

4.2.1基本列操作0

4.2.2基本行操作0

4.3Pandas检索0

4.3.1基本检索0

4.3.2多行检索0

4.3.3多列检索0

4.3.4行列检索0

4.3.5条件检索

4.3.6重新检索

4.3.7更换检索

4.4Pandas数据运算

4.4.1算术运算

4.4.2排序

4.4.3函数应用和映射

4.4.4统计方法

4.5Pandas处理缺失值

4.5.1查找缺失值

4.5.2删除缺失值

4.5.3填充缺失值

4.6数据载入与输出

4.6.1读/写文本文件

4.6.2读/写Excel文件

4.7数据聚合与分组

4.7.1merge数据合并

4.7.2concat轴向连接

4.7.3检测与处理重复值

4.7.4数据分组

4.8综合案例

4.8.1背景介绍

4.8.2数据整理目标

4.8.3数据读取与初步探索

4.8.4数据的清洗与整理

4.8.5数据查看

4.8.6数据的分组整理

4.8.7数据保存

4.9本章小结


第5章数据可视化

5.1Matplotlib可视化

5.1.1Matplotlib基本图形 

5.1.2Matplotlib自定义设置

5.2pyecharts可视化

5.2.1pyecharts的安装和使用

5.2.2pyecharts的常用图形

5.3本章小结


第6章科学计算与机器学习

6.1SciPy科学计算库

6.1.1SciPy简介

6.1.2SciPy常量包

6.1.3SciPy积分

6.2scikitlearn机器学习库

6.2.1线性回归

6.2.2逻辑回归

6.2.3k均值聚类

6.3本章小结


第7章机器学习综合案例

7.1“泰坦尼克”事件的生存率预测

7.1.1提出问题

7.1.2理解数据

7.1.3数据基本分析

7.1.4数据预处理

7.1.5逻辑回归建模

7.2本章小结


参考文献