目录




源码下载


第一部分Python基础知识

第1章Python概述

1.1Python简介

1.2Python的特点和应用领域

1.2.1Python的特点

1.2.2Python的应用领域

1.3Python开发环境的搭建

1.3.1Python的下载

1.3.2Python的安装

1.4Anaconda的下载与安装

1.5Anaconda中的Python开发环境

1.5.1Jupyter的使用

1.5.2Spyder的使用

1.5.3使用Conda管理包

1.5.4第三方包管理的例子

1.6使用百度AI Studio云计算编程环境

1.6.1登录AI Studio平台

1.6.2创建项目

1.6.3启动并运行项目

1.7Python的运行原理

1.8Python的编写规范

1.8.1行和缩进

1.8.2多行语句

1.8.3Python引号

1.8.4Python注释

1.9本章小结

第2章Python基础语法

2.1标识符与变量

2.1.1Python标识符

2.1.2Python关键字

2.1.3变量与赋值

2.2输入与输出

2.2.1数据的输入

2.2.2数据的输出

2.2.3输入和输出实战例题

2.3Python数据结构

2.3.1标量——基本数据类型

2.3.2序列类型——列表、元组和字符串

2.3.3映射类型——字典

2.3.4集合类型

2.3.5Python数据结构实战例题

2.4运算符与表达式

2.5Python流程控制

2.5.1顺序结构

2.5.2选择结构

2.5.3循环结构

2.6本章实战例题

2.7本章小结

2.8本章习题

第3章函数

3.1函数概述

3.1.1模块和包

3.1.2什么是函数

3.2函数的定义

3.3参数传递

3.3.1实参变量指向不可变对象

3.3.2实参变量指向可变对象

3.4函数参数的设置

3.4.1函数参数的类型

3.4.2位置参数

3.4.3默认参数

3.4.4关键字参数

3.4.5可变参数

3.5匿名函数

3.6递归函数

3.7本章实战例题

3.8本章小结

3.9本章习题

第4章类与对象

4.1面向对象

4.2类与对象的联系


4.3类的定义与使用

4.4属性

4.4.1实例属性和类属性

4.4.2公有属性和私有属性

4.5方法

4.5.1实例方法

4.5.2类方法

4.5.3静态方法

4.6继承

4.6.1隐性继承

4.6.2覆盖

4.6.3super继承

4.6.4多重继承

4.7运算符重载

4.8本章实战例题

4.9本章小结

4.10本章习题

第二部分数据分析相关库

第5章NumPy基础与应用

5.1NumPy简介

5.2NumPy数组基础

5.2.1数组的属性

5.2.2创建数组

5.2.3数组的数据类型

5.2.4数组的迭代

5.2.5数组的索引和切片

5.2.6数组的合并与拆分

5.3数组的相关操作

5.3.1统计相关操作

5.3.2形状相关操作

5.3.3数组的四则运算、点乘与比较操作

5.4数组的读/写

5.4.1数组的读取

5.4.2数组的写入

5.5本章实战例题

5.6本章小结

5.7本章习题

第6章Pandas基础与应用

6.1Pandas简介

6.1.1Pandas的主要特点


6.1.2Pandas的安装

6.2Pandas中的数据结构

6.2.1Series

6.2.2DataFrame

6.3Pandas中数据的基本操作

6.3.1数据的导入和导出

6.3.2数据的选取

6.3.3数据的编辑

6.3.4数据的合并

6.4数据运算与分析

6.4.1数据的算术运算和比较运算

6.4.2数据排序

6.4.3统计分析

6.4.4分组与聚合

6.4.5透视表与交叉表

6.5本章实战例题

6.6本章小结

6.7本章习题

第7章Matplotlib 基础及应用

7.1Matplotlib简介

7.1.1Matplotlib的主要特点

7.1.2Matplotlib的安装

7.2Matplotlib的基础知识

7.2.1导入Matplotlib

7.2.2Matplotlib中图形(Figure)的构成

7.2.3Matplotlib的中文设置

7.3Pyplot的使用

7.3.1plt.plot()函数的使用

7.3.2子图

7.4Pyplot中的常用图形

7.4.1散点图

7.4.2柱状图

7.4.3直方图

7.4.4饼图

7.4.53D图

7.5本章实战例题

7.6本章小结

7.7本章习题

第三部分数据挖掘理论与算法应用

第8章分类

8.1分类概述

8.1.1分类的基本概念

8.1.2常用的分类算法

8.1.3分类算法的评价指标

8.2分类的理论知识

8.2.1信息熵

8.2.2信息增益

8.2.3基尼系数

8.3决策树

8.3.1决策树的基本概念

8.3.2决策树的算法过程

8.3.3scikitlearn中决策树的应用

8.4朴素贝叶斯分类器

8.4.1朴素贝叶斯分类器的基本介绍

8.4.2朴素贝叶斯分类器的算法过程

8.4.3scikitlearn中朴素贝叶斯分类器的应用

8.5支持向量机

8.5.1支持向量机简介

8.5.2支持向量机的算法过程

8.5.3scikitlearn中支持向量机的应用

8.6梯度提升决策树

8.6.1梯度提升决策树的基本概念

8.6.2梯度提升决策树的算法过程

8.6.3scikitlearn中梯度提升决策树的应用

8.7Python中分类预测模型的小结

8.8本章实战例题

8.9本章小结

8.10本章习题

第9章聚类

9.1聚类概述

9.1.1聚类的基本概念

9.1.2聚类中距离的度量

9.1.3聚类的常用算法

9.1.4聚类的评估

9.2基于划分的KMeans聚类算法

9.2.1KMeans的基本概念

9.2.2KMeans的算法过程

9.2.3scikitlearn中KMeans的应用

9.3基于层次分析的聚类

9.3.1基于层次分析的聚类的基本原理

9.3.2基于层次分析的聚类过程

9.3.3scikitlearn中Birch的应用

9.4基于密度的聚类

9.4.1基于密度的聚类的基本原理

9.4.2基于密度的聚类过程

9.4.3scikitlearn中DBSCAN的应用

9.5本章实战例题

9.6本章小结

9.7本章习题

第10章回归分析

10.1回归概述

10.1.1常用的回归模型

10.1.2回归分析的步骤

10.1.3回归的相关系数

10.1.4回归模型的评价指标

10.2线性回归

10.2.1线性回归的原理

10.2.2线性回归的应用

10.2.3一元线性回归

10.2.4多元线性回归

10.3逻辑回归

10.3.1逻辑回归的原理

10.3.2LogisticRegression的应用

10.3.3逻辑回归的应用

10.4其他回归

10.4.1多项式回归

10.4.2岭回归

10.4.3Lasso回归

10.5本章实战例题

10.6本章小结

10.7本章习题

第四部分综 合 案 例

第11章实战案例:  电商消费者数据分析

11.1案例背景

11.2数据加载和预处理

11.2.1加载需要的库及读入数据

11.2.2数据信息初步分析

11.2.3数据预处理


11.3探索性数据分析

11.3.1各国订单情况分析

11.3.2客户情况分析

11.3.3产品情况分析

11.3.4按时间分析销售数据

11.4本章小结

第12章实战案例:  乳腺癌数据分析与预测

12.1案例背景

12.2数据加载和预处理

12.2.1加载需要的库及读入数据

12.2.2数据信息初步分析

12.2.3数据预处理

12.3探索性数据分析

12.3.1诊断结果列的分布

12.3.2数据分布的可视化分析

12.3.3相关性分析

12.4分类模型

12.4.1LogisticRegression模型

12.4.2决策树模型

12.4.3SVM模型

12.5提升预测准确率的策略

12.5.1数据标准化或规范化

12.5.2特征选择

12.5.3参数调优

12.6本章小结

第13章实战案例:  钻石数据分析与预测

13.1案例背景

13.2数据加载和预处理

13.2.1加载需要的库及读入数据

13.2.2数据信息初步分析

13.2.3数据预处理

13.3探索性数据分析

13.3.1类别特征分析

13.3.2数值特征分析

13.3.3相关性分析

13.4回归模型的预测

13.5本章小结

参考文献