BIG DATA 前 言 本书将数据获取、数据存储、数据预处理、数据可视化和数据分析方法等内容进行了 简化和有机融合,旨在培养学生基于数据解决问题的思维方式,提升数据素养。本着循序 渐进和强化实践的原则,书中内容以适量和实用为度,注重结合生活实例,以“提出问题— 选择模型—解决问题”为主线,着重培养学生运用理论知识解决实际问题的能力。在编写 中力求条理清晰、层次分明、言简意赅、客观真实,是一本体系创新、深浅适度、重在应 用的大数据通识教育教程。 全书共3篇。第1篇(第1、2章)为基础篇,主要内容为大数据概述、Python及常用类库; 第2篇(第3~7章)为数据分析篇,重点阐述数据获取、存储、预处理、可视化和分析方法; 第3篇(第8~11章)为大数据平台篇,着重介绍Linux操作系统基础、大数据管理平台、 分布式存储和分布式处理。全书提供了大量应用实例,每章后附有习题。 本书第1章、第4章由佀同光编写;第2章由陈佳丽编写;第3章、第5章由徐秀杰 编写;第6章由刘夏编写;第7章的7.1~7.4节由王文和陈佳丽编写,7.5节由陈佳丽编 写;第8章由卢文锋编写;第9~11章由张仲妹编写;附录A由徐秀杰编写,附录B由 张仲妹编写。同时,山东帮客信息技术有限公司李永鹏、上海泛微网络科技股份有限公司 吕长远参与了部分案例编写。全书由佀同光担任主编,并负责全书的修改及统稿。本书获 山东建筑大学教材建设基金资助,在编写过程中得到了山东建筑大学管理工程学院、山东 帮客信息技术有限公司、上海泛微网络科技股份有限公司的大力支持,在此表示衷心的感 谢。还得到了山东财经大学管理科学与工程学院博士生导师刘政敏教授、山东省大数据局 邹丰义研究员的指导。 由于编者水平有限,书中不当之处在所难免,欢迎广大同行和读者批评指正。 编 者 2023年1月