前言

党的二十大报告指出,教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。

在当今大数据的时代,数据是最为宝贵的资源,是社会管理、商业应用、科学研究、国防安全的决策基础。随着对数据容量、数据访问便捷性和数据安全性重视程度的提升,几乎所有的信息系统都需要使用数据库系统来组织、存储、管理数据,人们对新型数据库技术的研究和关注日益增多。同时,目前的数据库系统相关书籍主要讲解关系数据库以及NoSQL数据库,研究状况也局限于多年之前,缺少对NoSQL以及NewSQL全面系统的介绍。基于上述背景,本书主要基于新一代数据库技术,介绍以NoSQL、NewSQL数据库为代表的大数据存储的相关理论、设计思想以及应用。


本书主要内容

全书分为三部分共10章。

第一部分为大数据相关基础知识,包括第1~3章。第1章绪论,介绍数据存储基本概念、数据存储的发展阶段、大数据基本概念以及大数据时代的数据存储关键技术。第2章回顾数据库发展史,概括数据库发展简史,按数据库发展时间线依次介绍网状与层次数据库、关系数据库、NoSQL、NewSQL,随后介绍中国数据库的发展历史,最后展望下一代数据库的关键技术。第3章介绍数据库的基本原理、设计原则以及评价标准。


第二部分为NoSQL基础与应用,包括第4~8章。第4章介绍NoSQL基本原理以及键值数据库、列族数据库、文档数据库及图数据库4类NoSQL数据库的设计思想。第5章介绍键值数据库实例: Redis与DynamoDB,包括对Redis与DynamoDB基础知识、关键技术或工作原理的介绍以及Redis的安装实践。第6章介绍列族数据库实例: HBase与Cassandra,包括对HBase与Cassandra基础知识、关键技术或工作原理的介绍以及安装实践。第7章介绍文档数据库实例: MongoDB与CouchDB,包括对MongoDB与CouchDB基础知识、关键技术或工作原理的介绍以及安装实践。第8章介绍图数据库实例: Neo4j与ArangoDB,包括对Neo4j与ArangoDB基础知识、关键技术或工作原理的介绍以及安装实践。


第三部分为NewSQL基础与应用,包括第9、10章。第9章介绍NewSQL数据库的基本原理、分类以及设计思想。第10章介绍3种典型的NewSQL数据库: TiDB、Vitess和CockroachDB,包括对这3种典型NewSQL数据库基础知识、工作原理的介绍以及安装实践。


本书特色

(1) 问题驱动,由浅入深。


本书通过分析大数据存储涉及的核心问题,由浅入深、逐步地对数据库的重要概念及原理进行讲解与探究,为读者更好地掌握大数据存储的原理提供便利和支持。

(2) 注重原理,抓住前沿。

本书重点从原理讲述不同数据库的设计思想,结合实例帮助学生理解不同数据库的特点,同时由于本书涉及的内容更新较快,本书尽量将当前研究热点、研究方向也纳入进来。

(3) 风格简洁,使用方便。

本书风格简洁明快,对于非重点的内容不做长篇论述,以便读者在学习过程中明确内容之间的逻辑关系,更好地掌握大数据存储技术的内容。


配套资源

为便于教与学,本书配有数据集、教学课件、教学大纲、教学日历、期末试卷及答案、软件安装包。


(1) 获取数据集、软件安装包: 先扫描本书封底的文泉云盘防盗码,再扫描下方二维码,即可获取。




数据集




软件安装包



(2) 其他配套资源可以扫描本书封底的“书圈”二维码,关注后回复本书书号,即可下载。


读者对象

本书主要面向大数据及相关专业的本科生和计算机专业的研究生,也包括广大从事大数据存储与管理等领域的专业人员、高等院校教师及相关领域的科研人员。



本书得到国家自然科学基金(No: 41971366,91846301)和中央高校基本科研业务费专项资金资助(BUCTRC: 202132),特此感谢。北京化工大学信息科学与技术学院宏德时空数据智能实验室的窦泽平、于萦雪、于珊珊同学参与了部分书稿的编写和修改,北京化工大学信息科学与技术学院王友清院长、俞度立教授、张帆副院长和其他老师也提供了支持和帮助,在此一并表示感谢。同时,在本书的编写过程中,参考了诸多相关资料,在此对相关资料的作者表示衷心的感谢。

限于本人水平和时间,加之大数据存储技术的飞速发展,书中难免有疏漏之处,欢迎广大读者批评指正。


郭旦怀
2023年3月