目录


第1章商务智能

1.1商务智能的概念 

1.2商务智能的功能

1.3商务智能的组成要素

1.4商务智能的核心技术

1.5商务智能的系统框架

1.6商务智能的分析流程

1.7商务智能的主流产品

1.8习题

第2章数据仓库

2.1数据仓库的基本概念

2.1.1数据仓库的数据结构

2.1.2数据仓库的系统构成

2.1.3数据仓库系统开发概述

2.1.4数据仓库系统设计调研

2.1.5信息包图设计概念模型

2.2多维数据模型

2.2.1多维数据建模

2.2.2事实表、维表和键的设计

2.3在线分析处理

2.3.1在线分析处理概况

2.3.2在线分析处理的基本概念和典型操作

2.3.3在线分析处理的分类

2.4Hive简介

2.4.1Hive 的概念

2.4.2Hive的数据模型

2.4.3Hive与数据仓库

2.5习题

第3章数据准备

3.1数据准备的基本知识

3.2数据类型及处理方式

3.2.1统计计量角度的数据类型

3.2.2计算机角度的数据类型

3.2.3数据处理方式

3.3数据准备的主要内容

3.3.1数据清洗

3.3.2数据归一化

3.3.3数据离散化

3.3.4数据降维

3.3.5文本清洗

3.4ETL

3.5习题





第4章相关分析

4.1相关分析的基本原理

4.2相关关系

4.3相关系数

4.4相关分析步骤

4.5偏相关分析

4.6习题

第5章聚类分析

5.1聚类的基本概念

5.2“亲疏程度”的衡量与计算

5.2.1定距型变量个体间的距离计算

5.2.2计数变量个体间的距离计算

5.2.3二值变量个体间的距离计算

5.2.4其他个体间的距离计算

5.3聚类的方法

5.3.1K均值聚类算法

5.3.2K中间值聚类算法

5.3.3均值漂移聚类算法

5.3.4基于密度的聚类算法

5.3.5高斯混合模型聚类算法

5.3.6层次聚类算法

5.3.7图团体检测算法

5.4习题

第6章回归分析

6.1线性回归原理

6.1.1一元线性回归模型

6.1.2回归参数的计算

6.1.3回归方程的统计检验

6.1.4一元线性回归方程的预测

6.2多元线性回归分析

6.2.1二元线性回归分析

6.2.2m元线性回归分析

6.2.3非线性回归分析

6.3逻辑回归

6.3.1逻辑回归的基本原理

6.3.2二项逻辑回归分析

6.3.3多项逻辑回归分析

6.4习题

第7章分类分析

7.1分类分析原理

7.2贝叶斯分类

7.2.1基本原理

7.2.2平滑处理

7.3决策树分类

7.3.1基本原理

7.3.2信息增益

7.3.3决策树的过拟合和剪枝

7.4神经网络分类

7.4.1基本原理

7.4.2神经元模型

7.4.3网络结构

7.4.4深度学习

7.5习题

第8章关联分析

8.1频繁模式与关联规则

8.1.1基本概念

8.1.2频繁项集的性质

8.1.3频繁项集的代表项集

8.1.4关联规则的度量

8.2频繁项集的典型挖掘方法

8.2.1先验算法

8.2.2频繁模式增长算法

8.2.3关联规则的产生方法

8.3关联规则的其他类型

8.3.1多层关联规则

8.3.2负模式

8.3.3结构化数据的关联分析

8.4习题

第9章文本挖掘

9.1文本挖掘的概念

9.2文本挖掘的技术背景

9.3文本挖掘的任务

9.4文本挖掘的预处理

9.5文本模式挖掘

9.6挖掘结果可视化

9.7文本特征和表示

9.7.1向量空间模型

9.7.2概念模型

9.8文本挖掘的应用

9.8.1基于关键字的关联分析

9.8.2文本自动聚类

9.8.3自动文本分类

9.8.4自动摘要

9.8.5中文分词

9.9习题

第10章大数据分析

10.1云计算与大数据

10.2大数据存储

10.3大数据的应用

10.3.1制造业

10.3.2农业

10.3.3金融业

10.3.4零售业

10.3.5物流行业

10.3.6医疗行业

10.4Hadoop开源框架

10.4.1Hadoop简介

10.4.2HDFS 架构及简介

10.4.3MapReduce简介

10.4.4YARN

10.4.5Hadoop存储格式

10.5Spark 开源框架

10.5.1Spark简述

10.5.2Spark SQL

10.5.3Spark Streaming

10.5.4Spark MLlib 

10.6习题

第11章社会网络

11.1社会网络的基本问题

11.2社会网络的基本理论

11.2.1图论

11.2.2博弈论

11.3社会网络的基本原则

11.3.1三元闭包

11.3.2桥和捷径

11.3.3小世界与无标度

11.4社会网络与商务智能

11.4.1用户行为分析

11.4.2利用贝叶斯规则验证群集效应

11.5习题

第12章商务智能开发工具——RapidMiner

12.1RapidMiner简介

12.2连接数据

12.3关联分析实验

12.4线性回归实验

12.5聚类分析实验

12.6逻辑回归实验

12.7朴素贝叶斯实验

12.8关联规则及购物篮分析实验

12.9文本挖掘实验

第13章商务智能开发工具——Logis PMT大数据挖掘平台

13.1Logis PMT简介

13.2快运客户群识别综合实验

13.3电信用户流失率分析综合实验

13.4共享单车需求预测综合实验

13.5图像识别分类综合实验

参考文献