目录 第1章大数据基本概念及其应用00 1.1大数据应用概况00 1.1.1大数据的定义00 1.1.2大数据的特点00 1.1.3大数据的结构00 1.1.4相关技术00 1.1.5现状与趋势00 1.2大数据处理步骤00 1.2.1数据获取00 1.2.2数据存储00 1.2.3数据管理00 1.2.4数据分析0 1.3应用案例0 1.3.1商品推荐服务0 1.3.2公共信息服务0 1.3.3数据呈现服务0 第2章数据获取0 2.1格式转换与数据清洗整理0 2.2网页数据获取0 2.2.1八爪鱼采集原理与安装0 2.2.2模板采集任务0 2.2.3自定义采集模式0 第3章数据分析入门0 3.1Weka简介与数据预处理0 3.1.1软件下载 0 3.1.2文件与数据格式0 3.1.3Weka程序界面0 3.1.4数据预处理0 3.2数据分类0 3.2.1J48决策树分类器0 3.2.2LinearRegression分类器0 3.2.3M5P分类器0 3.3数据聚类0 3.3.1SimpleKMeans聚类器0 3.3.2EM聚类器0 3.3.3DBSCAN聚类器0 3.4数据关联0 3.4.1关联规则相关概念0 3.4.2Apriori算法介绍0 3.4.3Weka中Apriori关联规则挖掘0 3.5选择属性0 3.5.1属性选择概述0 3.5.2Weka中Select attributes标签页0 3.5.3选择属性模式介绍0 3.5.4Weka中选择属性操作示例0 3.6数据可视化0 3.6.1Visualize标签页0 3.6.2数值型类别属性可视化0 第4章数据分析进阶0 4.1贝叶斯网络0 4.1.1贝叶斯公式简介0 4.1.2贝叶斯网络简介 4.1.3创建贝叶斯网络 4.1.4使用贝叶斯网络进行推理 4.2神经网络 4.2.1神经网络介绍 4.2.2Weka神经网络选项设置 4.2.3编辑神经网络 4.2.4神经网络参数调整 4.3时间序列分析及预测 第5章Tableau数据可视化 5.1Tableau概述与入门 5.1.1概述 5.1.2下载与安装 5.1.3数据类型 5.1.4Tableau Desktop软件界面 5.1.5文件类型 5.2初级可视化分析 5.2.1条形图 5.2.2直方图 5.2.3饼图 5.2.4折线图 5.2.5压力图 5.2.6树地图 5.2.7气泡图 5.3地图分析 5.3.1认识地图 5.3.2创建地图 5.4高级数据操作 5.4.1分层结构 5.4.2组 5.4.3集 5.4.4参数 5.4.5计算字段 5.5分析图表整合 5.6案例一: 无锡市宜居时间分析 5.6.1创建计算字段 5.6.2空气质量 5.6.3气温 5.6.4宜居时间 5.6.5制作仪表板 5.7案例二: 佛山市纳税企业增长情况分析 5.7.1创建字段 5.7.2预测 5.7.3剖析行业 5.7.4剖析区域 5.7.5制作仪表板 5.7.6分析 第6章数据分析拓展 6.1数据分析拓展引言 6.1.1研究背景及实验数据 6.1.2研究方法 6.2k最近邻算法 6.2.1k最近邻算法的基本原理 6.2.2Weka中k最近邻算法(kNN)应用实践 6.3支持向量机 6.3.1支持向量机算法基本原理 6.3.2Weka中SVM算法应用实践 6.4逻辑回归算法 6.4.1逻辑回归算法基本原理 6.4.2Weka中的逻辑回归算法应用实践 6.5随机森林算法 6.5.1随机森林算法基本原理 6.5.2Weka中的随机森林算法应用实践 6.6模型性能评估(一) 6.7模型性能评估(二) 第7章数据思维 7.1数据分析基础 7.1.1相关概念 7.1.2数据分析可以帮用户做什么 7.1.3如何做有效的数据分析 7.2数据分析思维、过程和方法 7.2.1数据分析思维 7.2.2数据分析过程 7.2.3数据分析方法 7.2.4数据分析结果展示 参考文献