目录


第1章初识Python机器学习

1.1机器学习简介

1.1.1机器学习的起源及发展

1.1.2监督学习

1.1.3无监督学习

1.1.4半监督学习

1.1.5强化学习

1.1.6机器学习程序开发步骤

1.1.7机器学习发展现状

1.1.8机器学习的未来

1.2使用Python语言开发

1.3NumPy函数库基础

1.3.1NumPy函数库的安装

1.3.2NumPy函数库入门

1.4SciPy函数库基础

1.4.1SciPy函数库的安装

1.4.2SciPy函数库入门

1.5Matplotlib库

1.5.1Matplotlib库的安装

1.5.2Matplotlib库的使用

1.6集成开发环境Anaconda

1.7本章小结

1.8习题

第2章K近邻算法

2.1K近邻算法概述

2.1.1K近邻算法的基本思想

2.1.2K近邻的距离度量表示法

2.1.3K值的选择

2.2K近邻算法的实现: KD树

2.2.1KD树简介

2.2.2KD树的构建

2.2.3搜索KD树

2.3实战: 利用K近邻算法改进约会网站

2.4本章小结

2.5习题





第3章决策树

3.1决策树与信息熵

3.1.1决策树简介

3.1.2信息与自信息

3.1.3信息熵

3.1.4信息增益与划分数据集

3.2构建决策树

3.3可视化决策树

3.3.1注释结点

3.3.2构建完整的注解树

3.4基尼指数与CART算法

3.5决策树的剪枝

3.6本章小结

3.7习题

第4章朴素贝叶斯

4.1概率分布与贝叶斯决策论

4.2条件概率

4.3贝叶斯分类

4.4朴素贝叶斯分类

4.5实战: 利用朴素贝叶斯分类模型进行文档分类

4.5.1将单词表转换为向量

4.5.2概率计算

4.5.3通过朴素贝叶斯模型进行文件分类

4.6实战: 利用朴素贝叶斯分类模型过滤垃圾邮件

4.6.1切分文本

4.6.2通过朴素贝叶斯模型过滤垃圾邮件

4.7本章小结

4.8习题


第5章逻辑回归与梯度下降

5.1逻辑回归与Sigmoid函数

5.1.1逻辑回归简介

5.1.2Sigmoid函数简介

5.2梯度下降算法

5.2.1二维坐标系中的梯度下降算法

5.2.2三维坐标系中的梯度下降算法

5.3通过梯度下降算法找到最佳参数

5.4决策边界

5.5梯度下降算法的改进

5.5.1批量梯度下降算法

5.5.2随机梯度下降算法

5.6本章小结

5.7习题

第6章支持向量机

6.1支持向量机简介

6.2寻找最大间隔

6.3序列最小优化

6.3.1序列最小化算法简介

6.3.2通过序列最小优化算法处理小规模数据集

6.3.3通过完整的序列最小优化算法进行优化

6.4核函数及其应用

6.4.1高斯核函数

6.4.2高斯核函数的应用

6.5本章小结

6.6习题

第7章AdaBoost算法

7.1集成学习算法简介

7.2AdaBoost算法原理

7.3单层决策树与AdaBoost算法

7.4实战: 通过AdaBoost算法进行分类

7.5非均衡分类

7.5.1分类性能度量指标: 正确率、召回率

7.5.2分类性能度量指标: ROC曲线

7.5.3非均衡数据的采样方法

7.6本章小结

7.7习题

第8章线性回归

8.1线性回归原理

8.1.1简单的线性回归

8.1.2多元线性回归

8.2局部加权线性回归

8.3正则化的线性回归

8.3.1岭回归

8.3.2Lasso回归

8.4方差与偏差的平衡

8.5本章小结

8.6习题

第9章Kmeans算法

9.1无监督学习算法

9.2Kmeans算法简介

9.3构建简单的Kmeans模型

9.4K值的选择

9.4.1肘部法则

9.4.2轮廓系数

9.4.3间隔统计量

9.4.4Canopy算法

9.5二分Kmeans算法

9.6本章小结

9.7习题

第10章Apriori算法

10.1关联分析算法简介

10.2Apriori算法的工作原理

10.3实战: Python编程发现频繁项集

10.4实战: Python编程发现强关联规则

10.5本章小结

10.6习题

第11章FPgrowth算法

11.1FPgrowth算法简介

11.2构建FP树

11.2.1创建FP树的数据结构

11.2.2通过Python构建FP树

11.3通过FPgrowth算法提取频繁项集

11.3.1提取条件模式基

11.3.2创建条件FP树

11.4实战: 从超市购物清单中发掘信息

11.5本章小结

11.6习题

第12章主成分分析

12.1数据降维

12.2实战: 通过Python实现简单的主成分分析

12.3对Iris数据集降维

12.4本章小结

12.5习题

第13章奇异值分解

13.1特征值分解

13.2奇异值分解简介

13.3实战: 通过Python实现图片压缩

13.4基于协同过滤的推荐算法

13.4.1推荐算法概述

13.4.2协同推荐系统概述

13.4.3实战: 通过Python实现基于用户的协同推荐系统

13.4.4实战: 通过Python实现基于物品的协同推荐系统

13.4.5构建推荐引擎面临的挑战

13.5本章小结

13.6习题