目录 第1章机器学习的发展史1 引言1 1.1机器学习1 1.1.1机器学习的定义和研究意义1 1.1.2机器学习的发展史3 1.1.3机器学习系统的基本结构4 1.1.4机器学习的分类5 1.1.5目前研究领域9 1.2统计模式识别问题9 1.2.1机器学习问题的表示10 1.2.2经验风险最小化11 1.2.3复杂性与推广能力12 1.3统计机器学习理论的核心内容13 1.3.1学习过程一致性的条件13 1.3.2推广性的界13 1.3.3结构风险最小化15 1.4解耦因果学习16 1.4.1因果学习17 1.4.2相关工作18 1.4.3解耦因果学习方法与应用18 1.5总结21 课后习题21 第2章决策树学习22 引言22 2.1决策树学习概述22 2.1.1决策树23 2.1.2性质24 2.1.3应用24 2.1.4学习24 2.2决策树设计25 2.2.1决策树的特点25 2.2.2决策树的生成25 2.3总结30 课后习题30 第3章PAC模型31 引言31 3.1基本的PAC模型31 3.1.1PAC简介31 3.1.2基本概念31 3.1.3问题框架32 3.2PAC模型样本复杂度分析33 3.2.1有限空间样本复杂度33 3.2.2无限空间样本复杂度34 3.3VC维计算35 3.4总结36 课后习题36 第4章贝叶斯学习37 引言37 4.1贝叶斯学习37 4.1.1贝叶斯公式37 4.1.2最小误差决策38 4.1.3正态密度38 4.1.4最大似然估计39 4.2朴素贝叶斯原理及应用40 4.2.1贝叶斯最佳假设原理40 4.2.2基于朴素贝叶斯的文本分类器40 4.3HMM(隐马尔可夫模型)及应用43 4.3.1马尔可夫性43 4.3.2马尔可夫链44 4.3.3转移概率矩阵44 4.3.4HMM(隐马尔可夫模型)及应用44 4.4总结48 课后习题49 第5章支持向量机50 引言50 5.1支持向量机概述50 5.1.1margin最大化50 5.1.2支持向量机优化51 5.2支持向量机的实例55 5.3支持向量机的实现算法55 5.4多类支持向量机57 5.5总结58 课后习题58 第6章AdaBoost59 引言59 6.1AdaBoost与目标检测59 6.1.1AdaBoost算法59 6.1.2AdaBoost训练61 6.1.3AdaBoost实例62 6.2具有强鲁棒性的实时目标检测63 6.2.1Haarlike矩形特征选取63 6.2.2积分图63 6.2.3训练结果64 6.2.4级联64 6.3随机森林65 6.3.1原理阐述66 6.3.2算法详解66 6.3.3算法分析67 6.4总结67 课后习题68 第7章压缩感知69 引言69 7.1压缩感知理论框架69 7.2压缩感知的基本理论及核心问题70 7.2.1压缩感知的数学模型70 7.2.2信号的稀疏表示70 7.2.3信号的观测矩阵71 7.2.4信号的重构算法72 7.3压缩感知的应用72 7.3.1应用72 7.3.2人脸识别73 7.4总结74 课后习题75 第8章子空间76 引言76 8.1基于主成分分析的特征提取76 8.2数学模型78 8.3主成分的数学上的计算78 8.3.1两个线性代数的结论78 8.3.2基于协方差矩阵的特征值分解79 8.3.3主成分分析的步骤80 8.4主成分分析的性质80 8.5基于主成分分析的人脸识别方法81 8.6总结82 课后习题82 第9章神经网络与深度学习83 引言83 9.1神经网络及其主要算法83 9.1.1前馈神经网络83 9.1.2感知器83 9.1.3反向传播算法85 9.2深度学习87 9.2.1深度学习算法基础与网络模型87 9.2.2深度学习算法原理88 9.2.3卷积神经网络算法原理91 9.3深度学习网络模型94 9.3.1深度学习网络架构94 9.3.2网络模型优化95 9.3.3代表性的网络模型97 9.4总结102 课后习题102 第10章调制压缩神经网络103 引言103 10.1神经网络模型压缩概述103 10.1.1量化与二值化104 10.1.2剪枝与共享104 10.2调制压缩神经网络106 10.3损失函数107 10.4前向卷积108 10.4.1重构卷积核108 10.4.2调制网络的前向卷积过程109 10.5调制卷积神经网络模型的梯度反传110 10.6MCN网络的实验验证112 10.6.1模型收敛效率114 10.6.2模型时间分析114 10.6.3实验结果114 课后习题115 第11章批量白化技术116 引言116 11.1批量标准化技术116 11.2批量白化方法117 11.2.1随机坐标交换问题117 11.2.2ZCA白化119 11.3批量白化模块121 11.4分析和讨论123 11.4.1提高模型的条件情况123 11.4.2近似的动态等距性124 11.5总结124 课后习题125 第12章正交权重矩阵126 引言126 12.1多个依赖的Stiefel流优化126 12.2正交权重矩阵的特性127 12.2.1稳定激活值的分布127 12.2.2规整化神经网络127 12.3正交权重标准化技术128 12.3.1设计正交变换128 12.3.2反向传播129 12.3.3正交线性模块130 12.4实验与分析131 12.4.1求解多个依赖的Stiefel流优化问题方法比较131 12.4.2多层感知机实验133 12.4.3ImageNet 2012大规模图像数据分类实验134 12.5总结135 课后习题135 第13章强化学习136 引言136 13.1AlphaGo技术136 13.2强化学习概述139 13.3强化学习过程140 13.3.1马尔可夫性140 13.3.2奖励141 13.3.3估价函数141 13.3.4动态规划141 13.3.5蒙特卡罗方法142 13.3.6时序差分学习143 13.4Q学习算法144 13.4.1Q学习算法介绍144 13.4.2奖励145 13.4.3Q学习算法的改进147 13.5程序实现148 课后习题151 参考文献152