前言 习近平总书记在党的十九大报告中提出,要“推动互联网、大数据、人工智能和实体经济深度融合”,强调“贯彻新发展理念,建设现代化经济体系”。大数据、VR、AR和人工智能等信息技术必将为社会发展和时代进步注入新的生机和血液。 为此,本书从理论、相关技术和实际应用三个层面对大数据应用进行了简明扼要的阐述,目的是让广大师生对大数据的应用方法和相关知识有所了解,更好地把握科学发展的方向。 大数据技术教学在我校已连续开展五年,并已成为大学计算机教育的重要组成部分,为国家培养了一批掌握最新科学发展动态和技能的数字化医学人才,同时也积累了一定的教学经验。 在编写原则上,本书既维持了大数据技术本身应有的系统性和理论性,又着重体现其在各个领域的应用性与针对性。本书注重启发式的学习策略,便于读者理解和掌握书中内容。全书在各章均附有实际应用案例与关键词注释,方便读者查阅和自学,同时配备了相应的习题。 本书主编为娄岩、胡仕坤、袁磊,副主编为邱永建、陈继超、靳瑞霞、李然。全书在内容上共分成11章: 第1章大数据概论由娄岩编写; 第2章大数据采集由王杰、寇志谦编写; 第3章大数据分析由朱云峰、王欣编写; 第4章Hadoop由王维、熊玮编写; 第5章Spark由王维、庞玲玲、李然编写; 第6章NoSQL概论由李超科、王魏编写; 第7章云计算与大数据由陈继超、郭晨荣编写; 第8章数据仓库Hive由庞玲玲、陈继超编写; 第9章大数据可视化由靳瑞霞、熊玮编写; 第10章大数据安全由袁磊、邱永建编写; 第11章大数据应用案例分析(医疗领域)由胡仕坤、邱永建编写。 清华大学出版社对这本教材的出版做了充分论证和精心策划,在此向所有参加编写的同事、帮助和指导过我们工作的朋友以及本书参考文献的作者表示衷心的感谢! 由于编者水平有限,加之时间仓促,书中难免存在疏漏之处,恳请广大读者批评斧正! 娄岩 2021年5月