前言 在过去的20年,计算机和互联网的飞速发展使人们的生活方式发生了巨大变化,同时也产生了海量的数据,大数据时代已经到来!近几年,以大数据为基础的人工智能成为万众瞩目的焦点,人工智能正在影响人们生活的各个方面。在人工智能的研究过程中,人们发现机器学习是实现让计算机智能化的最有效手段。 目前,很多高校都开设了智能科学与技术专业。“机器学习”是该专业的核心课程。国内外已经出版了多本关于机器学习的书籍,例如,James的An Introduction to Statistical Learning,该书对机器学习的各个方面进行了非常全面、细致的介绍。机器学习所涉及的内容众多,很难通过一本书将所有问题都介绍清楚。本书从机器学习最基本的模型出发,介绍机器学习的基本概念、模型和方法。这些内容是学习后续课程(如“计算机视觉”“自然语言处理”“深度学习”等)的基础。 本书力求简洁、直观地介绍机器学习的方法。在内容的选择上,侧重介绍广泛使用的方法,特别是监督学习和无监督学习的经典方法。在介绍这些内容时,通过第1章介绍机器学习的基本概念和主要分支,让读者对机器学习有一个全面的了解。其余各章内容相对独立、完整,同时也注重各章节内容的连贯性,如将贝叶斯分类安排在线性回归、感知机、logistic回归之后介绍,其原因在于这些模型都与贝叶斯分类模型有联系。决策树是很多集成算法(如随机森林等)的基础,因此本书在介绍完决策树后再介绍集成学习;在介绍线性回归的原理时,会通过投影的观点来理解该模型,这一观点在后面理解主成分分析时也会用到。在介绍具体的机器学习模型时,都会给出具体的应用,同时还会基于sklearn框架介绍如何实现这些应用,而且对于一些比较困难的内容,会通过微课的方式对其进行介绍。在每章的后面都给出了内容总结、习题和参考文献,以方便读者进一步学习。 在本书的出版过程中,清华大学出版社的白立军编辑、杨帆编辑给予了很多帮助,在此向他们表示感谢。本书的出版也得到了重庆工商大学研究生教改项目“基于二维码的研究生互动教学改革”(2015YJG0205),重庆市教育科学规划项目(2018CX348),教育部产学合作协同育人项目(201902100005),教育部产学合作协同育人项目(201902016028)的支持。 由于作者水平所限,书中难免有错误或不妥之处,欢迎读者批评指正。 刘波2020年10月