目录 第一部分基础篇 第1章机器学习基础 1.1机器学习概述 1.1.1机器学习任务 1.1.2重要概念 1.1.3性能评估 1.2编程语言与环境 1.2.1Python简介 1.2.2Python环境配置与安装 1.2.3Python机器学习编程库 1.2.4PyTorch框架 第2章数据预处理 2.1数据清洗 2.1.1缺失值处理 2.1.2离群值检测 2.2数据转换 2.2.1数字化 2.2.2离散化 2.2.3正规化 2.2.4数值转换 2.3数据压缩 2.3.1降维 2.3.2实例选择和采样 2.4应用案例: 基于PCA的数据降维 2.4.1数据集 2.4.2PCA降维 2.4.3案例结果及分析 第3章简单分类算法 3.1朴素贝叶斯分类算法 3.2KNN分类算法 3.2.1KNN算法实现原理 3.2.2KNN算法实现步骤 3.2.3KNN算法优缺点 3.3应用案例: KNN分类 3.3.1数据集 3.3.2构建KNN分类器 3.3.3案例结果及分析 第4章决策树 4.1决策树模型 4.2特征选择 4.2.1特征和数据划分 4.2.2划分标准 4.3决策树生成算法 4.3.1ID3决策树生成算法 4.3.2C4.5决策树生成算法 4.4CART算法 4.4.1决策树的剪枝 4.4.2CART生成算法 4.4.3CART剪枝算法 4.5应用案例: 基于决策树的鸢尾花图像分类 4.5.1数据集 4.5.2构建决策树 4.5.3案例结果及分析 第5章支持向量机 5.1支持向量机的基本原理 5.1.1线性可分 5.1.2最大间隔问题 5.1.3支持向量 5.2常用核函数 5.2.1线性核函数 5.2.2高斯核函数 5.2.3多项式核函数 5.3应用案例: 基于SVM的异或数据集划分 5.3.1数据集及数据预处理 5.3.2构建SVM分类器 5.3.3案例结果及分析 第6章回归分析 6.1线性回归 6.1.1简单线性回归 6.1.2多元线性回归 6.2多项式回归 6.3正则化回归 6.3.1岭回归 6.3.2最小绝对收缩与选择算子 6.3.3弹性网络 6.4随机森林回归 6.5回归模型的性能评估 6.6回归模型的实现 6.6.1线性回归实现 6.6.2多项式回归实现 6.6.3正则化回归实现 6.6.4随机森林回归实现 6.7应用案例: 基于随机森林的房价预测 6.7.1数据集 6.7.2数据预处理 6.7.3随机森林回归模型建立 6.7.4案例结果及分析 第7章聚类分析 7.1聚类概述 7.1.1性能度量 7.1.2距离计算 7.2Kmeans算法 7.3层次聚类 7.4密度聚类 7.4.1DBSCAN相关概念 7.4.2DBSCAN算法流程 7.5应用案例 7.5.1Kmeans应用案例 7.5.2层次聚类应用案例 7.5.3DBSCAN应用案例 第8章神经网络与多层感知机 8.1神经元模型 8.2感知机原理及结构 8.2.1单层感知机 8.2.2多层感知机 8.2.3反向传播算法 8.3应用案例: 基于多层感知机的手写数字识别 8.3.1数据集及数据预处理 8.3.2三层感知机构建 8.3.3案例结果及分析 第二部分综合篇 第9章基于CNN的图像识别 9.1CNN的基本组成 9.1.1卷积运算基本过程 9.1.2多通道卷积 9.1.3池化 9.2CNN模型简介 9.3基于PyTorch构建CNN 9.4应用案例: 基于CNN的人脸性别识别 9.4.1数据集 9.4.2数据预处理 9.4.3搭建卷积神经网络 9.4.4案例结果及分析 第10章基于RNN的序列数据分类 10.1面向序列数据的机器学习 10.1.1RNN相关背景知识 10.1.2序列数据 10.1.3序列数据与建模 10.2RNN的常用网络结构 10.2.1基本结构 10.2.2简单循环网络模型 10.2.3门控算法模型 10.3基于PyTorch构建LSTM 10.4应用案例: 基于LSTM的文本分类 10.4.1数据准备 10.4.2模型构建和实现 10.4.3训练模型 10.4.4测试模型 第11章基于GNN的文本分类 11.1GNN基础 11.1.1GNN模型简介 11.1.2GCN模型简介 11.2GCN构建 11.2.1代码层次结构 11.2.2代码实现 11.3应用案例: 基于GCN的文本分类 11.3.1TextGCN介绍 11.3.2基于TextGCN的文本分类 11.3.3案例结果及分析 第12章基于GAN的图像生成 12.1GAN概述 12.1.1自编码器 12.1.2生成模型 12.1.3GAN基本原理 12.1.4GAN模型结构 12.1.5GAN的两种目标函数 12.1.6GAN的训练 12.2基于PyTorch构建GAN 12.2.1网络结构 12.2.2基于PyTorch建立GAN模型 12.3应用案例: 基于GAN的图像生成 12.3.1FashionMNIST数据集 12.3.2数据预处理 12.3.3搭建GAN模型 12.3.4案例结果及分析 第三部分拓展篇 第13章基于百度飞桨的车道线检测 13.1百度飞桨平台简介 13.2百度AI Studio平台简介 13.3使用AI Studio平台创建第一个项目 13.4应用案例: 车道线检测 13.4.1车道线检测数据集 13.4.2评价指标 13.4.3数据预处理 13.4.4模型构建 13.4.5训练和预测 第14章基于旷视天元MegEngine的目标检测 14.1旷视天元MegEngine平台简介 14.1.1MegEngine整体架构 14.1.2旷视天元平台特点 14.2MegEngine平台使用方法 14.2.1注册 14.2.2创建项目 14.3应用案例: 基于MegEngine的目标检测 14.3.1MSCOCO数据集 14.3.2目标检测评估指标 14.3.3模型训练与测试 第15章机器学习竞赛平台实践 15.1主流竞赛平台 15.1.1Kaggle竞赛 15.1.2天池大数据竞赛 15.2Kaggle竞赛实践 15.2.1应用案例1: 泰坦尼克之灾 15.2.2应用案例2: 细粒度犬种识别 15.2.3应用案例3: Home Depot产品相关性预测 15.3天池大数据竞赛实践 15.3.1应用案例1: 街景字符编码识别 15.3.2应用案例2: NLP新闻文本分类 15.3.3应用案例3: 贷款违约预测 参考文献