前 言 Python是一种用途非常广泛的编程语言,具有非常清晰的语法特点,适用于多种操 作系统。目前在国际上非常流行,尤其在人工智能与大数据领域正在得到越来越广泛的 应用。Python 可以完成许多任务,功能强大,旗下的Numpy、Pandas 是进行数据清洗的 利器。近年来,Python经常被使用在各个领域,成为一种热门的计算机语言,它对其他 语言,都有很好的调用接口,如 R和 C等,并且在内存的使用上也有优化。 本书的第一次出版是在2017年,本次是对《Python数据分析基础》的再版。通过 近年来若干轮教学的积累,编者对数据分析这门课程有了更深层次的理解,对第一版的 整体框架结构和内容都做了很大的调整和补充,包括补充了正则表达式,Numpy库,以 及可视化库Plotly。本书基于 Python 3.10进行了一些示例的改进和知识点的更新,并增 加了综合应用案例。本书第1~3章为 Python 的基础部分,第4~6章为利用 Numpy 库和Pandas 库对数据进行清洗、分析、可视化,也是本书的重点内容,第7章为综合应 用案例。 本书的内容由浅入深,比较适合从未接触过计算机语言的零基础读者,每章配有示 例代码,希望读者在使用本书时,尽可能地自己写代码,少用复制粘贴的方法,这样有 利于读者尽快地进入“角色”。 本书的出版得到了海南省自然科学基金(822RC713)的资助和支持。 最后,感谢广大读者选择并使用本书。欢迎各位读者来信批评指正。 编 者