前言 大数据因其巨大价值和集中化的存储管理模式,成为网络攻击的重点目标。近年来,全球大数据安全事件呈频发态势,数据被窃取、泄露、滥用和损毁的问题日趋严重。2017年,习近平总书记在中共中央政治局就实施国家大数据战略第二次集体学习时强调,要切实保障国家数据安全,要强化国家关键数据资源保护能力,增强数据安全预警和溯源能力。2021年两会上,政务大数据安全也成为了重要的议题。 目前,全面系统介绍大数据安全技术的书籍市面上较少,本书结合作者在网络空间安全与大数据技术相关领域的教学和科研实践,在全面梳理和分析国内外在大数据安全保护技术、标准规范及法律政策等资料的基础上,重点对大数据安全和隐私保护的相关技术、基础理论及相关法律政策等进行了全面介绍。本书提供一定量的实验案例,搭配详细操作流程,注重实践操作能力的培养。使用本书,可以提高读者对大数据安全的理解与应用,增强理论与实践、技术与管理相结合的能力,全面掌握大数据安全核心技术和最新进展,也为大数据和网络安全从业者提供数据安全保护技术参考和管理政策指导,为我国大数据产业的健康发展提供有效支撑。 本书共12章,内容讲解逻辑清晰,前后关联,通俗易懂。第1章统领全书,对大数据安全相关技术做概述性描述;第2章介绍密码学的基本概念、分组密码、序列密码、公钥密码、Hash函数、数字签名和密钥管理等内容,以及IPSec、SSL/TLS等网络安全协议;第3章对大数据处理平台Hadoop进行介绍,包括其安全机制、技术架构等内容;第4章对常见的几类身份认证技术进行介绍,并重点对Kerberos认证体系进行详细说明;第5章介绍各类访问控制技术及具体实践操作;第6章针对大数据平台的数据加密,从静态与动态两方面展开具体介绍,并加入实验部分,以增强动手实践能力;第7章介绍大数据采集阶段的安全技术,包括采集技术、数据分类分级、数据采集安全等内容;第8章介绍大数据存储阶段的安全技术,聚焦于大数据存储方法、存储介质安全、逻辑存储安全、数据备份与数据恢复等;第9章介绍大数据处理阶段的敏感数据识别与脱敏、同态加密、安全多方计算、联邦学习、私有信息检索、虚拟化技术及安全;第10章介绍大数据交换阶段的安全技术,并介绍了隐私保护的技术种类与模型;第11章聚焦于各类数据分析算法,重点介绍其算法基础与攻击方式等安全问题;第12章介绍国内外大数据安全与隐私保护的相关法律法规。 本书由芦天亮(中国人民公安大学)、陈光宣(浙江警察学院)、张璐(山东警察学院)、曹金璇(中国人民公安大学)、刘强(浙江警察学院)、王锋(浙江警察学院)共同编写。其中,曹金璇编写了第1章,芦天亮编写了第2章、第5章和第6章,王锋编写了第3章和第11章,陈光宣编写了第4章和第10章,刘强编写了第7章和第12章,张璐编写了第8章和第9章。初稿完成后,先由主编对全书进行了第一次统稿,最后由芦天亮定稿。杨成、王曦锐、陈秋雨、刘亚琳、邓泗波、于兴崭等中国人民公安大学研究生协助完成了部分文档的整理工作。在编写过程中,参阅了中国电子技术标准化研究院、中国信息通信研究院等单位发布的数据安全相关国家标准和研究报告,也吸取了国内外技术书籍、学术论文及相关网络资料的精髓,对这些作者的贡献表示由衷的感谢。本书在章节结构设计及内容撰写过程中,得到中国电子技术标准化研究院信息安全研究中心数据安全部主任胡影的大力帮助。本书在出版过程中得到清华大学出版社的大力支持,在此表示诚挚的谢意! 由于作者水平有限,书中难免有不妥和疏漏之处,恳请各位专家、同仁和读者批评指正。 本书编写组2022年5月