前〓〓言 党 的二十大报告指出:教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,这三大战略共同服务于创新型国家的建设。高等教育与经济社会发展紧密相连,对促进就业创业、助力经济社会发展、增进人民福祉具有重要意义。 在当今大数据时代,数字经济的快速发展使得各行各业处于数字化转型的快速发展时期,数字信息更是以大量高速的状态不断增长。旅游产业作为一个对社会信息变化高度敏感的行业,对高质量数据分析的需求也逐渐增多。 2023年,全国文化和旅游产业发展工作会议指出,当前我国人民群众对文化和旅游产品供给提出了更高的要求,要认真研判产业发展面临的新形势、新变化,准确把握产业发展重点工作方向,进一步发挥文化和旅游消费在稳增长、扩内需中的重要作用。 旅游大数据分析可以帮助旅游部门分析相关数据,在此基础上做好公共管理服务,提升旅游业管理决策能力; 可以帮助旅游景区进行游客分析、数据挖掘,有效指导景区的运营发展; 能帮助旅游企业查找不足,为游客定制个性化的旅游服务,提高旅游服务质量; 能帮助旅游企业进行市场分析、客户需求分析,更新营销策略并做好旅游经营策略管理,提高旅游市场判断力,从而推动整个旅游产业的发展。由此可见,旅游大数据分析对旅游业的发展至关重要。 Python是一门轻量级的数据分析语言,它灵活、轻便,可以与各行各业相结合,从而极大地提高人们的工作效率。将Python应用在旅游大数据分析中,即对旅游数据进行合法抓取并存储,结合实际需求对数据进行分析,再以可视化的角度进行呈现。 Python旅游大数据分析是一门新的交叉学科应用领域,迫切需要对此进行系统论述。 本书以Windows和PyCharm为平台,完整地对“网络数据采集—数据解析—数据存取—数据处理分析—数据可视化”的数据分析过程进行系统论述,并介绍各个板块所需要的基本技术; 以旅游数据分析为案例进行实践开发,以两个大型旅游数据分析项目的开发为例,完整展示了Python旅游数据分析的过程和实践。 全书共9章。第1章介绍了大数据的概念、发展及主要技术,第2章介绍了Python的基础知识,第3章介绍了网络公开数据的采集方法,第4章介绍了数据解析方法,第5章介绍了数据存取方法,第6章介绍了数据处理与分析方法,第7章介绍了数据可视化方法,第8章设计了两个旅游大数据综合案例,第9章总结了本书的相关研究。 本书对携程网、12306、去哪儿网等进行数据采集,仅用于学习交流,不作为商业用途,不宜频繁采集,以免影响网站运行。书中所有实验均通过测试,但仍然可能会出现网站结构升级导致程序不能正常运行的情况,请读者知悉。 为便于学习和理解,本书提供软件安装包、程序源码等资源,可在目录上方的资源下载二维码中获取。 本书的出版基于以下项目的研究成果: 重庆旅游职业学院2022年校级课题(xj2223)、重庆旅游职业学院2023年教学质量与教学改革工程建设项目(YJKG2023001)、重庆市教委2023年科学技术研究计划项目(KJQN202304604)。 由于作者水平有限,书中错漏在所难免,敬请读者批评指正。 作者2023年7月