前言 大数据泛指大规模、超大规模的数据集,因可从中挖掘出有价值的信息而备受关注。数据挖掘是一个涉及数据库技术、人工智能、统计学、机器学习等多个学科的领域,并且已经在各行各业有了非常广泛的应用。为适应我国数据挖掘的教学工作,作者在数据挖掘教学实践的基础上,参阅了多种国内外最近版本的教材,编写了本书。本书可以作为高等院校研究生的教材,也可以为相关行业的工程技术人员提供有益的参考。 本书内容循序渐进,对大数据挖掘的基本算法进行了详细的讲解。本书最大的特点是理论与实践相结合,算法理论与产业一线实践相结合,几乎所有的算法都配有实例和基于阿里云大数据平台(数加平台)的演示,这种理论与实际相结合的方法克服了只重理论、轻实践的内容组织方式,极大地方便了读者的理解。具体而言,本书11章内容之间的关系如下图所示。 本书提供的教学课件,读者可登录www.tup.com.cn网站自行下载。由于编者水平有限,书中必定存在不足之处,恳请专家和读者批评指正。 编者2023年1月