前 言 大数据时代已经到来,随着数据的逐步开放,交通领域的研究课题或多或少都要接 触、使用时空大数据。交通领域中大数据的实际应用需求增加,也促使交通数据分析师、 交通数据科学家的职业诞生。交通领域的从业者迫切需要强有力的工具和技术应对日益纷 杂的交通数据。 交通领域目前需要处理的数据通常规模巨大、种类繁多,数据通常涉及个体级别连 续追踪的时空数据。其中,数据所包含的最重要的信息包括:谁?什么时候?在哪里? 数据通常有多种来源,各种类型的数据格式不同、数据特征不同、数据质量不同, 则要求我们的处理技术能够灵活多变,针对不同数据情况有不同的处理方法。在时间层面 的连续追踪,相比传统的数据库检索处理,在处理过程中则更加强调连续数据之间时间序 列前后的逻辑,我们关注的不再只是单一的某条数据,而是时间上连续的几条、几十条 记录;在空间层面的GPS定位数据,在处理过程中则要求我们能够将经纬度转换、距离计 算、空间位置关系判断、空间聚合集计等地理空间数据处理技术紧密、高效、无缝地与整 个数据处理流程相衔接。如何应对多源时空大数据?前面提到的众多要求对我们所需掌握 的数据处理技术带来了巨大挑战。 在获取交通时空数据后,我们马上就会面临着以下工作:如何处理数据?如何处理 GPS定位数据的经纬度信息?如何可视化数据?如何获取其他辅助的数据(如路网、公交 和地铁线路等)?同时,我们还要关注:各类数据有什么特征?怎么样处理这些数据才更 合适、更高效? 然而,这其中所遇到的很多问题都是传统的交通学科所学课程内容无法囊括与解答 的。交通学子可能需要在没有接触过编程的时候就需要写出足以处理大规模数据的代码, 在没有学习了解地理坐标系与投影坐标系的情况下就要处理经纬度数据,在没有学习过数 据可视化的基本原则时就需要绘制图表并展示数据。这样的工作很可能是低效的,数据处 理所产生的结果也可能是有偏差或错误的。 因此,交通领域需要有一本教材能够系统地梳理交通时空数据处理中所涉及的各种基 础知识,总结数据处理过程中的各类解决方案,介绍如何用跨学科的方法从数据中挖掘出 有价值的信息。 本书,就是为这一目的而生。