前言 当前,在教学、研究和开发领域,数据可视化是一个极为活跃而又关键的方向。特别是在大数据时代,面对规模、种类快速增长的数据,可视化已然成为各个领域传递信息不可缺少的手段,是快速理解数据的必然要求。通过合理的可视化设计,管理者可以将自己关心的所有数据都汇集到一张仪表盘中,把人从浩如烟海的表格中解放出来。大数据可视化还可辅以机器学习等技术,使管理者不仅可以了解过去数据的规律,还可以借助计算机强大的预测、拟合等能力,来窥探未来的趋势,借此在瞬息万变的网络时代占得先机。 可以说,现代社会几乎每个领域都在主动或者被动地应用大数据思维、大数据方法,并借此得以优化管理,促进生产力的提升。然而很多人对大数据可视化还存在一定误区。大数据是大容量、高速度并且数据之间存在很大差异的数据集,但大数据可视化并不意味着所有数据都必须可视化。虽然现在计算机硬件性能在飞速提升,但是这么做还是会带来算力的浪费、成本的提高以及可视化速度的下降。优秀的可视化展示出的都是最有价值、最能影响决策的信息,而某些数据并不需要可视化方法来表达。另外,并不是高质量的数据才值得做可视化,对于低质量数据,简单的可视化便于快速定位错误。可视化省去了很多麻烦,但是不一定总能依靠可视化做出正确的决定,它并不能替代批评思维,一些糟糕的可视化还可能因为过于注重视觉效果而给人传达出误导性信息。 本书的主要内容——大数据可视化技术,一直是应用和研究领域的热点,也是一门非常复杂的技术。本书着重于基础知识和常用软件的讲解,对前沿技术进行了简单介绍。此外,还涉及一些大数据可视化支持技术的介绍,如数据库等。希望本书能给想了解大数据可视化技术的读者带来帮助。 本书的主编为吕云翔、姚泽良,副主编为谢吉力、朱英豪、仇善召、韩延刚、黄泽桓,闫坤审核,曾洪立参与了部分内容的编写并进行了素材整理及配套资源制作等。 由于主编水平有限,书中难免会有内容的疏漏,恳请各位同仁和广大读者给予批评指正,也希望各位读者能将实践过程中的经验和心得与我们交流。 编者2023年3月