前言
党的二十大报告中指出: 教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,这三大战略共同服务于创新型国家的建设。高等教育与经济社会发展紧密相连,对促进就业创业、助力经济社会发展、增进人民福祉具有重要意义。

信息技术的快速发展引发了数据规模的爆炸式增长,大数据引起了国内外学术界、工业界和政府部门的高度重视,被认为是一种新的非物质生产要素,蕴含巨大的经济和社会价值,并将导致科学研究的深刻变革,对国家的经济发展、社会发展、科学进展具有战略性、全局性和长远性的意义。

数据为人类社会带来机遇的同时也带来了风险,围绕数据产权、数据安全和隐私保护的问题也日益突出,并催生了一个全新的命题——数据治理。综合来看,数据治理是指从使用零散数据变为使用统一数据、从具有很少或没有组织流程到企业范围内的综合数据管控、从数据混乱状况到数据井井有条的一个过程。随着大数据在各个行业领域应用的不断深入,数据作为基础性战略资源的地位日益凸显,数据标准化、数据确权、数据质量、数据安全、隐私保护、数据流通管控、数据共享开放等问题越来越受到国家、行业、企业各个层面的高度关注,这些内容都属于数据治理的范畴。因此,数据治理的概念越来越多地受到人们关注,成为目前大数据产业生态系统中的新热点。

本书以理论与实践操作相结合的方式深入讲解了大数据治理与安全的基本知识和实现的基本技术,在内容设计上既有上课时老师的讲述部分,包括详细的理论与典型的案例,又有大量的实训环节,双管齐下,极大地激发了学生在课堂上的学习积极性与主动创造性,让学生在课堂上跟上老师的思维,从而学到更多有用的知识和技能。

本书共9章,主要包括数据治理概述、数据采集与数据道德、数据质量与数据管理、数据交换与数据集成、数据库设计与治理、架构设计与治理、数据仓库设计与治理、大数据安全与治理及综合实训。

本书的特色如下: 

(1) 采用“理实一体化”教学方式,课堂上既有老师的讲述,又有学生独立思考、上机操作的内容。

(2) 紧跟时代潮流,注重技术变化,书中包含最新的大数据治理知识及一些开源库的使用。建议读者在阅读本书前具备一定程度的大数据基础知识,了解Hadoop框架,并熟悉一门编程语言。此外,读者在阅读本书时还需安装MySQL及Kettle等相关软件。

(3) 编写本书的老师都具有多年的教学经验,能够激发学生的学习热情。

(4) 为便于教学,本书提供丰富的配套资源,包括教学大纲、教学课件、习题答案、程序源码、教学进度表和在线作业。


资源下载提示

课件等资源: 扫描封底的“课件下载”二维码,在公众号“书圈”下载。

素材(源码)等资源: 扫描目录上方的二维码下载。

在线作业: 扫描封底的作业系统二维码,登录网站在线做题及查看答案。




本书可作为高等院校大数据专业、人工智能专业、软件技术专业、云计算专业、计算机网络专业的专业课教材,也可作为大数据爱好者的参考书。

本书的建议学时为54学时,具体分布如下表所示。






章建议学时

数据治理概述2

数据采集与数据道德8

数据质量与数据管理8

数据交换与数据集成6

数据库设计与治理8

架构设计与治理6

数据仓库设计与治理6

大数据安全与治理6

综合实训4


本书由黄源任主编,龙颖、吴文灵、杨瑞峰任副主编。其中,黄源编写了第1~7章; 龙颖编写了第9章; 吴文灵和杨瑞峰共同编写了第8章。全书由黄源负责统稿工作。

本书在编写过程中得到了中国电信金融行业信息化应用重庆基地总经理助理杨琛的大力支持,在此表示感谢。另外,在本书编写过程中编者参阅了大量的资料,在此对相关作者表示感谢。

由于编者水平有限,书中难免出现疏漏之处,希望广大读者批评、指正。



编者2023年7月于重庆