前言


机器学习是计算机科学和人工智能中非常重要的一个领域,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。本书是一本理工类专业的基础教材,为了让更多的读者能通过本书对机器学习有所实践,本书弱化了机器学习的数学基础知识,同时采用Python语言实现算法。Python代码简单优雅、易于上手,科学计算和机器学习软件包众多,已成为不少大学和研究机构进行教学和研究的语言。相信用Python编写的机器学习代码也能让读者尽快领略到这门学科的精妙之处。
本书作为机器学习领域的基础教材,在内容上尽可能实用且易于上手实践,从机器学习理论到Python实践,对机器学习领域经典方法进行了全面介绍,首先对机器学习进行概述,然后分4部分展开介绍,第1部分介绍监督学习,包括线性模型、决策树分类、贝叶斯分类器、集成学习和支持向量机;第2部分介绍无监督学习,包括关联规则、聚类分析和数据降维;第3部分介绍深度学习,包括神经网络、深度学习和生成对抗网络(GAN);第4部分介绍强化学习。本书所介绍的经典机器学习算法及其应用案例均配有相关实验数据和Python代码实现,通过对应用使用Python语言全过程实现,读者可在不知不觉中加深对经典算法的理解,获得机器学习项目经验,提高编程能力,同时快速领悟看似难懂的机器学习理论。每章末尾均有习题和实验题,便于读者巩固知识和开展课内实验。读者可根据自己的知识储备、兴趣和时间情况选择使用。本书通过经典算法、算法Python实现和实际应用的“三位一体法”,强化对经典算法的理解和掌握,期望读者能对经典算法做到“精”和“通”。
本书第1章由王曙燕编写,第2、6和9章由路龙宾编写,第3、4、5、7、8、12和13章由孙家泽编写,第10章由王红玉编写,第11章由田振洲编写,孙家泽负责全书的校稿工作。感谢西安邮电大学可信软件研究团队的各位同学在稿件的修改和应用的编写中给予的帮助和支持,同时感谢很多领域专家在网络上共享的资源,这些对本书的编写有很大的启发。这里还要特别感谢本书编辑龙启铭,没有龙编辑的帮助,就没有本书的出版。
机器学习的发展日新月异,中国人工智能科技产业发展风起云涌,技术体系包括大数据和云计算、物联网、5G、智能机器人、计算机视觉、自动驾驶、智能芯片、智能推荐、虚拟/增强现实、语音识别、区块链、生物识别、光电技术、自然语言处理、空间技术、人机交互和知识图谱在内的很多类技术,构成了复杂技术体系。罕有人士能对其众多分支领域都精深理解。编者才疏学浅,领域仅略知皮毛,时间和精力所限,书中错误及疏漏之处在所难免,恳请读者批评指正,不胜感激。

编者
2023年1月