目录 第1章商务智能 1.1商务智能的概念 1.2商务智能的功能 1.3商务智能的组成要素 1.4商务智能的核心技术 1.5商务智能的系统框架 1.6商务智能的分析流程 1.7商务智能的主流产品 1.8习题 第2章数据仓库 2.1数据仓库的基本概念 2.1.1数据仓库的数据结构 2.1.2数据仓库的系统构成 2.1.3数据仓库系统开发概述 2.1.4数据仓库系统设计调研 2.1.5信息包图设计概念模型 2.2多维数据模型 2.2.1多维数据建模 2.2.2事实表、维表和键的设计 2.3在线分析处理 2.3.1在线分析处理概况 2.3.2在线分析处理的基本概念和典型操作 2.3.3在线分析处理的分类 2.4Hive简介 2.4.1Hive 的概念 2.4.2Hive的数据模型 2.4.3Hive与数据仓库 2.5习题 第3章数据准备 3.1数据准备的基本知识 3.2数据类型及处理方式 3.2.1统计计量角度的数据类型 3.2.2计算机角度的数据类型 3.2.3数据处理方式 3.3数据准备的主要内容 3.3.1数据清洗 3.3.2数据归一化 3.3.3数据离散化 3.3.4数据降维 3.3.5文本清洗 3.4ETL 3.5习题 第4章相关分析 4.1相关分析的基本原理 4.2相关关系 4.3相关系数 4.4相关分析步骤 4.5偏相关分析 4.6习题 第5章聚类分析 5.1聚类的基本概念 5.2“亲疏程度”的衡量与计算 5.2.1定距型变量个体间的距离计算 5.2.2计数变量个体间的距离计算 5.2.3二值变量个体间的距离计算 5.2.4其他个体间的距离计算 5.3聚类的方法 5.3.1K均值聚类算法 5.3.2K中间值聚类算法 5.3.3均值漂移聚类算法 5.3.4基于密度的聚类算法 5.3.5高斯混合模型聚类算法 5.3.6层次聚类算法 5.3.7图团体检测算法 5.4习题 第6章回归分析 6.1线性回归原理 6.1.1一元线性回归模型 6.1.2回归参数的计算 6.1.3回归方程的统计检验 6.1.4一元线性回归方程的预测 6.2多元线性回归分析 6.2.1二元线性回归分析 6.2.2m元线性回归分析 6.2.3非线性回归分析 6.3逻辑回归 6.3.1逻辑回归的基本原理 6.3.2二项逻辑回归分析 6.3.3多项逻辑回归分析 6.4习题 第7章分类分析 7.1分类分析原理 7.2贝叶斯分类 7.2.1基本原理 7.2.2平滑处理 7.3决策树分类 7.3.1基本原理 7.3.2信息增益 7.3.3决策树的过拟合和剪枝 7.4神经网络分类 7.4.1基本原理 7.4.2神经元模型 7.4.3网络结构 7.4.4深度学习 7.5习题 第8章关联分析 8.1频繁模式与关联规则 8.1.1基本概念 8.1.2频繁项集的性质 8.1.3频繁项集的代表项集 8.1.4关联规则的度量 8.2频繁项集的典型挖掘方法 8.2.1先验算法 8.2.2频繁模式增长算法 8.2.3关联规则的产生方法 8.3关联规则的其他类型 8.3.1多层关联规则 8.3.2负模式 8.3.3结构化数据的关联分析 8.4习题 第9章文本挖掘 9.1文本挖掘的概念 9.2文本挖掘的技术背景 9.3文本挖掘的任务 9.4文本挖掘的预处理 9.5文本模式挖掘 9.6挖掘结果可视化 9.7文本特征和表示 9.7.1向量空间模型 9.7.2概念模型 9.8文本挖掘的应用 9.8.1基于关键字的关联分析 9.8.2文本自动聚类 9.8.3自动文本分类 9.8.4自动摘要 9.8.5中文分词 9.9习题 第10章大数据分析 10.1云计算与大数据 10.2大数据存储 10.3大数据的应用 10.3.1制造业 10.3.2农业 10.3.3金融业 10.3.4零售业 10.3.5物流行业 10.3.6医疗行业 10.4Hadoop开源框架 10.4.1Hadoop简介 10.4.2HDFS 架构及简介 10.4.3MapReduce简介 10.4.4YARN 10.4.5Hadoop存储格式 10.5Spark 开源框架 10.5.1Spark简述 10.5.2Spark SQL 10.5.3Spark Streaming 10.5.4Spark MLlib 10.6习题 第11章社会网络 11.1社会网络的基本问题 11.2社会网络的基本理论 11.2.1图论 11.2.2博弈论 11.3社会网络的基本原则 11.3.1三元闭包 11.3.2桥和捷径 11.3.3小世界与无标度 11.4社会网络与商务智能 11.4.1用户行为分析 11.4.2利用贝叶斯规则验证群集效应 11.5习题 第12章商务智能开发工具——RapidMiner 12.1RapidMiner简介 12.2连接数据 12.3关联分析实验 12.4线性回归实验 12.5聚类分析实验 12.6逻辑回归实验 12.7朴素贝叶斯实验 12.8关联规则及购物篮分析实验 12.9文本挖掘实验 第13章商务智能开发工具——Logis PMT大数据挖掘平台 13.1Logis PMT简介 13.2快运客户群识别综合实验 13.3电信用户流失率分析综合实验 13.4共享单车需求预测综合实验 13.5图像识别分类综合实验 参考文献