前言 随着数据采集和存储技术的迅速发展,数据正以前所未有的速度爆炸式增长。海量数据成了各行各业重要的战略资源,围绕这些数据进行可行的深入分析,对几乎所有社会领域的决策都变得越来越重要。数据挖掘将传统的数据分析方法与用于处理大量数据的复杂算法相结合,利用数据库管理技术和大量以机器学习为基础的数据分析技术,为数据库中的知识发现提供有效支撑。 因此,本书从数据挖掘的过程出发,以数据挖掘的流程和主要的机器学习算法为主线,全面系统地介绍了数据挖掘的基本概念和主要思想、典型的机器学习算法以及利用Python实现数据挖掘与机器学习的过程。本书将数据挖掘的理论与方法和机器学习算法以及项目实践充分结合,以便加深加快读者对所学内容的理解和掌握。 全书共11章,内容涵盖数据理论基础、数据预处理、Python数据挖掘与可视化基础、关联规则挖掘、回归分析、分类、聚类、神经网络和离群点检测等内容。书中各章节相互独立,读者可根据自己的兴趣选择使用。各章力求原理叙述清晰,易于理解,突出理论联系实际,辅以Python代码实践与指导,引领读者更好地理解与应用算法,快速迈进数据挖掘领域,掌握机器学习算法的理论和应用。同时,书中每章都给出了小结和习题,可以帮助读者巩固本章学习内容,扩展相关知识。 本书配套资源丰富,包括教学大纲、教学课件、电子教案、程序源码、习题答案、教学进度表,作者还为本书精心录制了650分钟的微课视频。 资源下载提示 课件等资源: 扫描封底的“课件下载”二维码,在公众号“书圈”下载。 素材(源码)等资源: 扫描目录上方的二维码下载。 视频等资源: 扫描封底刮刮卡中的二维码,再扫描书中相应章节中的二维码,可以在线学习。 本书由魏伟一和张国治编写,由于作者水平有限,不当之处在所难免,恳请各位读者赐教指正。 本书在编写过程中得到了全国高等院校计算机基础教育研究会2020年度“面向新工科的数据挖掘教学改革与资源建设” 项目(2020AFCEC096)的资助,在此表示衷心感谢。 魏伟一2021年1月