随着科学技术的发展,数据量呈爆炸式增长,如何从海量数据中挖掘出有助于决策的知识显得尤为重要,这使得数据分析与数据挖掘技术受到极大的关注。为满足数据挖掘学习者的需要,2018年出版了本书第1版,不仅用于高等学校计算机专业的教学,同时也用于非计算机专业相关学科的教学,受到了广大教师和学生的欢迎。经过两年的教学实践,我们对本书进行了修订,以便更好地满足教学及应用需求。
本书主要介绍数据分析及数据挖掘中的基本概念和方法。本书知识点的讲解分别通过基础理论及概念、应用例题、习题三大部分进行,部分知识点涉及算法应用实例。通过相关理论及概念的介绍,使读者对数据分析与数据挖掘的基础算法有整体认识和了解;通过应用例题的讲解,使读者对算法过程有深刻理解;通过习题的训练,使读者能够巩固相应知识点。通过本书的学习,读者可以快速掌握数据分析与数据挖掘的基本概念和基本方法。
为方便教师备课及教学,我们提供了与本书第2版配套的电子课件,若教师需要可以与清华大学出版社联系。我们在学堂在线上同步开设了“数据挖掘”在线课程,以方便教师在线教学以及广大学习者在线学习。
本书第2版由喻梅、于健主编,王建荣、李雪威副主编。参与本书构思、撰写、审稿、应用实例的上机验证及截图校对的人员有喻梅、于健、王建荣、李雪威、王庆节、于瑞国、陈军、徐天一、赵满坤、高洁、刘志强、刘伟、张妍、刘莹、冯爽、邓锐、刘玉生、李盼、刘鸣喆等。在此也感谢对本书第1版做出贡献的编写者。
在全书的撰写过程中,得到了清华大学出版社和张瑞庆编审的大力支持,在此表示衷心的感谢。
本书编写过程中参考了一些教材和资料,具体见参考文献,在此对原作者表示诚挚的谢意。由于写作时间仓促,编者水平有限,书中疏漏和不当之处敬请读者批评指正,以便今后修订改正。借此机会,向使用本书的广大师生以及关心我们的同行和学者表示感谢。

编者2020年3月