前言

大数据概论是了解和学习大数据的基础。本书系统地讲解了大数据的基本概念、大数据的数据结构、大数据的特征、大数据的关键技术、大数据的计算模式、大数据的采集与存储、大数据的管理、大数据的分析与处理、大数据的可视化、大数据的应用、大数据的发展与展望。本书以易学、全面和实用为目的,从基础到应用,系统地介绍了大数据的关键技术和应用。本书共分为8章,主要内容如下。
第1章介绍大数据的基本知识,包括大数据的定义、大数据的结构类型、大数据的特征、大数据的关键技术、大数据的计算模式、大数据的应用、大数据的发展、大数据的意义。
第2章介绍Hadoop分布式架构,包括Hadoop的由来、Hadoop的优势、Hadoop的特性、Hadoop的应用现状、Hadoop的架构元素、Hadoop的集群系统、Hadoop的开源实现、Hadoop的信息安全、Hadoop的应用领域。
第3章介绍大数据采集与存储,包括大数据采集概述、大数据采集的数据来源、大数据的采集方法、分布式存储系统、分布式文件系统、HDFS概述、云存储、数据仓库。
第4章介绍大数据管理,包括数据管理概述、数据模型的管理、主数据的管理、元数据的管理、数据质量的管理、数据安全的管理。
第5章介绍大数据分析与处理,包括数据分析的概念、数据分析常用工具、数据分析的技术、数据分析的类型、数据分析的流程、数据分析的算法、大数据分析的数据类型、大数据分析的方法、大数据分析的总体框架、大数据分析的应用、大数据处理。
第6章介绍大数据可视化,包括数据可视化的概念、数据可视化的类型、数据可视化的目标与作用、数据可视化的主要技术、数据可视化的流程、大数据可视化的方法、大数据可视化的工具、大数据可视化的应用。
第7章介绍大数据应用,包括大数据在教育领域的应用、大数据在互联网领域的应用、大数据在金融领域的应用、大数据在通信领域的应用、大数据应用的未来发展趋势。第8章介绍大数据的发展与展望,包括大数据与云计算、大数据与人工智能、大数据与区块链、大数据安全与隐私保护技术发展前景、大数据未来展望。
为了便于教学,本书提供的PPT课件等教学资源可以从清华大学出版社网站(http://www.tup.com.cn)的下载区免费下载。
由于编者水平有限,书中难免存在疏漏,敬请读者批评、指正。
大数据概论
编者2021年2月