资源下载 目〓〓录 第1章大数据 1.1什么是数据 1.2数据的管理 1.3大数据的概念 1.4大数据的发展 1.5大数据的特点 1.6大数据的主要技术 1.7大数据的应用 第2章Python语言基础 2.1程序设计语言 2.1.1程序设计语言的发展 2.1.2常用的程序设计语言 2.2Python开发环境配置 2.2.1Python的安装 2.2.2PyCharm的安装 2.3基本语法 2.3.1编写风格 2.3.2注释方式 2.3.3数据类型 2.3.4表达式 2.4程序结构 2.4.1选择结构 2.4.2循环结构 2.4.3异常处理 2.5函数与模块 2.5.1函数 2.5.2模块 2.6序列数据 2.6.1字符串 2.6.2列表 2.6.3元组 2.6.4字典 2.7面向对象 2.7.1面向对象的概念 2.7.2Python面向对象编程 2.8文件操作 2.8.1打开、读取文件 2.8.2关闭文件 2.8.3写文件 2.8.4读文件的N个字符 2.8.5读文件的一行或多行字符 2.8.6不同编码 2.8.7用指针改变读写位置 第3章数据采集 3.1爬虫概述 3.1.1爬虫的基本概念 3.1.2爬虫的合法性 3.2网页与爬虫 3.2.1URL 3.2.2认识网页结构 3.2.3爬虫实现过程 3.3Requests库 3.3.1Requests库的安装 3.3.2Requests库的功能介绍 3.3.3用Requests爬取旅游网站数据 3.4Selenium抓取动态页面 3.4.1Selenium概述 3.4.2Selenium的安装 3.4.3Selenium的基本用法 3.4.4用Selenium爬取旅游网站数据 第4章数据解析 4.1数据解析技术 4.2正则表达式 4.3XPath 4.3.1XPath概述 4.3.2lxml库 4.3.3应用案例 4.4Beautiful Soup 4.4.1Beautiful Soup概述 4.4.2构建与输出 4.4.3遍历文档树 4.4.4搜索文档树 4.4.5应用案例 4.5综合爬取案例 第5章数据存取 5.1JSON 5.1.1JSON概述 5.1.2用JSON库存取JSON文件 5.1.3用Pandas库存取JSON文件 5.2CSV存取 5.2.1用CSV库存取CSV文件 5.2.2用Pandas库存取CSV文件 5.2.3应用案例 5.3XLSX存取 5.3.1用xlrd库存取XLSX文件 5.3.2用xlsxwriter库写入XLSX文件 5.3.3用Openpyxl库读/写、修改XLSX文件 5.3.4用Pandas库读/写XLSX文件 5.3.5应用案例 5.4数据库存取 5.4.1数据模型 5.4.2关系数据库的基本概念与运算 5.4.3关系数据库设计 5.4.4SQL语句 5.4.5在Python中操作MySQL 5.4.6应用案例 第6章数据处理与分析 6.1NumPy库 6.1.1创建数组 6.1.2数组的常用属性 6.1.3数组计算 6.1.4索引与切片 6.1.5应用案例 6.2Pandas库 6.2.1Series类型结构 6.2.2DataFrame类型结构 6.2.3数据计算 6.2.4数据清洗 6.2.5应用案例 6.3文本分析 6.3.1中文字符 6.3.2英文文本 6.3.3词云图 6.4游客点评数据分析 6.4.1景点点评数量与景点热度之间的相关性分析 6.4.2绘制欢乐谷点评的词云图 第7章数据可视化 7.1数据可视化概述 7.2Matplotlib可视化 7.3Pandas绘图 7.4Pyecharts可视化 7.5旅游数据分析结果可视化 第8章旅游大数据综合案例 8.1景点热度分析 8.1.1需求分析 8.1.2思路设计 8.1.3编写各模块代码 8.1.4编写主文档 8.1.5结论 8.2团购产品分析 8.2.1需求分析 8.2.2编写代码 8.2.3分析结果 第9章结论与展望 参考文献