目录 第1章数据仓库与数据挖掘概述1 1.1数据仓库的兴起1 1.1.1从数据库到数据仓库1 1.1.2从OLTP到OLAP3 1.1.3数据字典与元数据4 1.1.4数据仓库的定义与特点6 1.2数据挖掘的兴起7 1.2.1从机器学习到数据挖掘7 1.2.2数据挖掘含义8 1.2.3数据挖掘与OLAP的比较8 1.2.4数据挖掘与统计学9 1.3智能技术10 1.3.1智能技术简述10 1.3.2数据仓库与商务智能14 1.3.3数据挖掘与人工智能17 习题119 第2章数据仓库原理20 2.1数据仓库结构体系20 2.1.1数据仓库结构20 2.1.2数据集市及其结构22 2.1.3数据仓库系统结构24 2.1.4数据仓库的运行结构25 2.2数据仓库的数据模型26 2.2.1星形模型26 2.2.2雪花模型与星网模型28 2.2.3第三范式29 2.3数据抽取、转换和装载29 2.3.1数据抽取30 2.3.2数据转换31 2.3.3数据装载33 2.4元数据34 2.4.1元数据的重要性34 2.4.2关于数据源的元数据35 2.4.3关于数据模型的元数据35 2.4.4关于数据仓库映射的元数据36 2.4.5关于数据仓库使用的元数据37 习题238 〖3〗数据仓库与数据挖掘教程(第4版)目录〖3〗第3章联机分析处理39 3.1OLAP概念39 3.1.1OLAP的定义39 3.1.2OLAP准则40 3.1.3OLAP的基本概念42 3.2OLAP的数据模型43 3.2.1MOLAP数据模型43 3.2.2ROLAP数据模型44 3.2.3MOLAP与ROLAP的比较44 3.3多维数据的显示47 3.3.1多维数据的显示方法47 3.3.2多维类型结构48 3.3.3多维数据的分析视图49 3.4OALP的多维数据分析50 3.4.1多维数据分析的基本操作50 3.4.2多维数据分析实例52 3.4.3广义OLAP功能54 3.4.4数据立方体56 习题3 60 第4章数据仓库的决策支持61 4.1数据仓库的用户61 4.1.1信息查询者61 4.1.2知识探索者62 4.2数据仓库的决策支持与决策支持系统62 4.2.1查询与报表63 4.2.2多维分析与原因分析64 4.2.3预测未来65 4.2.4实时决策65 4.2.5自动决策66 4.2.6决策支持系统67 4.3基于数据仓库决策支持系统的应用实例68 4.3.1航空公司基本数据仓库决策支持系统简例68 4.3.2统计业数据仓库系统72 4.3.3沃尔玛数据仓库系统74 习题476 第5章数据挖掘原理77 5.1数据挖掘综述77 5.1.1数据挖掘与知识发现77 5.1.2数据挖掘任务与分类78 5.1.3不完全数据处理81 5.1.4数据库的数据浓缩83 5.2数据挖掘方法和技术85 5.2.1归纳学习的信息论方法85 5.2.2归纳学习的集合论方法86 5.2.3仿生物技术的神经网络方法87 5.2.4仿生物技术的遗传算法87 5.2.5数值数据的公式发现87 5.3数据挖掘的知识表示88 5.3.1规则知识88 5.3.2决策树知识88 5.3.3知识基(浓缩数据)89 5.3.4神经网络权值89 5.3.5公式知识89 5.3.6案例90 习题590 第6章信息论方法92 6.1信息论原理92 6.1.1信道模型和学习信道模型93 6.1.2信息熵与条件熵93 6.1.3互信息与信息增益95 6.1.4信道容量与译码准则95 6.2决策树方法96 6.2.1决策树概念96 6.2.2ID3算法基本思想97 6.2.3ID3算法98 6.2.4实例与讨论99 6.2.5C4.5算法101 6.3决策规则树方法103 6.3.1IBLE算法基本思想103 6.3.2IBLE算法105 6.3.3IBLE算法实例107 习题6113 第7章集合论方法115 7.1粗糙集方法115 7.1.1粗糙集概念115 7.1.2粗糙集方法的属性约简与实例117 7.1.3粗糙集方法的规则知识获取119 7.1.4粗糙集方法规则获取实例119 7.1.5约简集的选择122 7.2k均值聚类123 7.2.1聚类方法简介123 7.2.2k均值聚类算法与实例126 7.3关联规则挖掘127 7.3.1关联规则挖掘的原理127 7.3.2Apriori算法基本思想130 7.3.3基于FPtree的关联规则挖掘算法133 习题7136 第8章神经网络与深度学习138 8.1神经网络原理与反向传播网络138 8.1.1神经网络原理138 8.1.2反向传播网络139 8.1.3BP网络学习公式推导140 8.1.4BP网络的典型实例145 8.2神经网络的几何意义145 8.2.1神经网络的超平面含义145 8.2.2异或问题的实例分析147 8.3深度学习148 8.3.1深度学习与多层网络的链式法则148 8.3.2卷积网络深度学习算法153 8.3.3深度学习实例159 习题8164 第9章遗传算法与计算智能168 9.1遗传算法168 9.1.1遗传算法基本原理169 9.1.2遗传算子170 9.1.3遗传算法简例174 9.1.4遗传算法的特点176 9.2基于遗传算法的分类学习系统177 9.2.1概述177 9.2.2遗传分类学习系统的基本原理177 9.2.3遗传分类学习系统的应用181 9.3计算智能182 9.3.1计算智能概述182 9.3.2计算智能与人工智能184 习题9185 第10章强化学习、迁移学习和公式发现187 10.1强化学习187 10.1.1强化学习概念187 10.1.2强化学习算法与实例189 10.2迁移学习192 10.2.1迁移学习综述192 10.2.2迁移学习与类比学习比较194 10.2.3迁移学习与基于案例的推理比较195 10.3公式发现196 10.3.1曲线拟合与发现学习196 10.3.2科学定律发现系统199 10.3.3经验公式发现系统203 习题10207 第11章知识挖掘208 11.1软件进化规律的知识挖掘208 11.1.1数值计算的进化 208 11.1.2计算机程序的进化212 11.1.3数据存储的进化214 11.1.4知识处理的进化217 11.1.5进化规律的知识挖掘219 11.1.6小结222 11.2数学进化规律的知识挖掘222 11.2.1数学进化综述222 11.2.2数学进化的知识发现方法223 11.2.3数学发展中的映射变换226 11.2.4数学进化规律小结228 11.3变换规则的知识挖掘229 11.3.1适应变化环境的变换和变换规则230 11.3.2变换规则的知识挖掘的理论基础231 11.3.3变换规则的知识推理234 11.3.4变换规则链的知识挖掘235 11.3.5适应变化环境的变换规则元知识238 习题11241 第12章大数据与人工智能242 12.1大数据时代242 12.1.1从数据到决策的大数据时代242 12.1.2大数据的分析方法和决策支持方式245 12.1.3数据仓库与云计算248 12.2大数据型科学研究250 12.2.1大数据型科学研究范式250 12.2.2大数据中的小数据252 12.2.3科学研究中的相关性253 12.2.4矛盾与机遇两类相关性256 12.2.5大数据应用现状259 12.3人工智能260 12.3.1人工智能发展过程260 12.3.2人工智能目前研究的主要内容263 12.3.3人工智能的最新进展——生成式人工智能265 12.3.4中国人工智能研究的进展267 习题12268 附录A各章习题中部分问答题的参考答案270 附录B各章习题中设计题和计算题的参考答案288 参考文献304