前言


大数据和人工智能已经成为信息技术发展的新动能,围绕大数据和人工智能的创新层出不穷。究其根本,所有新思路和新技术都离不开高质量的数据,因此与数据相关的大数据技术体系,如数据采集、数据存储、并行计算、数据处理分析、编程工具Python、数据处理分析工具Pandas、数据可视化工具Matplotlib,以及与人工智能相关的机器学习算法和深度学习模型等,已成为学习大数据、人工智能的必备知识。基于这种现状,本书将上述知识按照逐层深入的思路进行整合,使之成为一条有机的阶梯式递进学习链,帮助读者从基础知识到应用实践一步步构建大数据和人工智能应用的知识体系。
本书以IT企业对从业人员技术能力要求为出发点,以工程实践能力培养为目标,按照工程需求组织内容,便于读者学习和掌握。本书既可以作为高校计算机类专业各层次的教材,还可以作为IT开发人员、非计算机专业师生和科研工作者的参考书。
本书具有以下特点:
(1) 知识覆盖面广,技术体系完整。本书涵盖大数据技术体系、Python编程基础知识、数据处理分析和可视化方法以及机器学习算法和深度学习模型等基础理论和相关应用知识。
(2) 理论和实践相结合。本书运用丰富的实践案例帮助读者理解相关原理和理论,同时用详细的操作步骤和直观的运行结果展示其背后的规则和算法,避免单调的理论叙述,易教易学。
(3) 配套资源丰富。本书提供配套的课件、例题案例、自测习题和各知识点的教学视频,适合线上线下混合式教学。
本书由高静、申志军、姜新华、陈俊杰、谢聪娇、左东石、刘敏、白洁和刘振羽等共同编写。其中,高静和刘振羽共同编写了第1章,白洁编写了第2章,申志军编写了第3、4章,刘敏编写了第5章,谢聪娇编写了第6章,姜新华编写了第7章,左东石编写了第8章,陈俊杰编写了第9章,全书由高静教授统稿。在编写过程中,参阅了Python、Pandas、Matplotlib和PyTorch的官网及中文社区,也吸取了国内外教材的精髓,在此对这些作者的贡献表示由衷的感谢。本书在出版过程中还得到了清华大学出版社张玥编辑的大力支持,在此向她表示诚挚的感谢。限于作者水平,书中难免有不妥和疏漏之处,恳请各位专家、同仁和读者不吝赐教,并与编者讨论,编者的邮箱是shensljx@sina.com。

编者
2022年4月