目录 第1章 导论与预备知识 1 1.1 数据分析的研究对象 1 1.2 向量空间 3 1.3 范数 7 1.4 内积空间 9 1.5 线性变换 12 1.6 特征值与特征向量 16 1.7 正交补空间和保范变换 23 1.8 多维随机变量 26 1.8.1 随机向量的分布和独立性 26 1.8.2 随机向量的数字特征 28 1.8.3 多维正态分布 29 1.9 多元统计量及抽样分布 36 1.9.1 总体、样本和统计量 36 1.9.2 估计量的评价标准 38 1.9.3 常用的多元抽样分布 41 拓展阅读建议 44 第1章习题 44 第2章 方差分析 46 2.1 单变量的均值检验 46 2.2 单变量的方差分析 49 2.3 多元均值检验 54 2.4 多元方差分析 59 2.5 协方差矩阵相等的检验 62 2.6 MATLAB方差分析工具 64 拓展阅读建议 67 第2章习题 68 第3章 关于总体分布的检验和独立性检验 69 3.1 拟合优度检验 69 3.1.1 多项分布的中心极限定理 69 3.1.2 拟合优度检验 71 3.1.3 理论分布中含有未知参数的拟合优度检验 75 3.2 正态性检验 78 3.2.1 图示法 79 3.2.2 拟合优度检验 85 3.2.3 Kolmogorov-Smirnov检验 87 3.2.4 偏度和峰度 89 3.2.5 Jarque-Bera检验 91 3.3 独立性检验 92 3.3.1 引例 92 3.3.2 列联表分析 94 拓展阅读建议 96 第3章习题 96 第4章 奇异值分解 99 4.1 奇异值分解定理 99 4.2 几何解释 104 4.3 应用 106 4.3.1 矩阵的低秩逼近和数据压缩 106 4.3.2 超定线性方程组和矩阵的伪逆 112 拓展阅读建议 114 第4章习题 114 第5章 多元线性回归分析 116 5.1 线性回归模型 116 5.2 最小二乘估计 117 5.3 几何解释 123 5.4 偏相关系数 126 5.5 线性回归模型的推断及评价 134 5.6 实例 137 拓展阅读建议 140 第5章习题 140 第6章 主成分分析 142 6.1 概述 142 6.2 数学模型 143 6.3 主成分模型的解 144 6.4 主成分的性质 147 6.5 主成分分析的计算实现 150 6.6 实践中需要考虑的问题 154 6.6.1 适合用主成分法降维的数据 154 6.6.2 是否先对数据进行标准化处理 156 6.6.3 应该保留多少个主成分 156 6.7 实例 161 拓展阅读建议 164 第6章习题 164 第7章 因子分析 165 7.1 概述 165 7.2 数学模型 167 7.3 因子模型的参数估计 168 7.3.1 主成分法 169 7.3.2 主因子法 171 7.3.3 极大似然估计 173 7.3.4 三种参数估计法的比较 176 7.4 因子旋转 179 7.4.1 基本思想 179 7.4.2 因子旋转方法 180 7.4.3 应用实例 182 7.5 因子得分的估计 186 7.5.1 最小二乘法 186 7.5.2 加权最小二乘估计 187 7.5.3 回归法 188 7.5.4 因子正交旋转对因子得分的影响 189 7.5.5 应用实例 189 拓展阅读建议 193 第7章习题 193 第8章 聚类分析 195 8.1 概述 195 8.2 相似性度量 196 8.2.1 距离 196 8.2.2 相似系数 198 8.2.3 用MATLAB计算距离矩阵和不相似度矩阵 199 8.3 系统聚类法 201 8.3.1 常用的系统聚类法 201 8.3.2 系统聚类法的步骤 205 8.3.3 系统聚类的实现 208 8.3.4 系统聚类法的性质 212 8.4 K-均值聚类 213 8.4.1 基本思想与算法 213 8.4.2 MATLAB实现 214 8.5 聚类分析实践中常遇到的问题 216 8.5.1 变量的选取 216 8.5.2 确定类的个数 216 8.5.3 聚类结果的解释 218 拓展阅读建议 220 第8章习题 220 第9章 多维标度分析 221 9.1 概述 221 9.2 多维标度分析的古典解 222 9.2.1 基本概念 222 9.2.2 欧氏距离结构的充要条件 223 9.2.3 多维标度分析的古典解 227 9.2.4 计算实例 228 9.3 多维标度分析的古典解与主成分的联系 233 9.4 非度量多维标度分析 235 9.4.1 概念及原理 235 9.4.2 实现 238 拓展阅读建议 241 第9章习题 241 第10章 判别分析和逻辑回归分析 243 10.1 概述 243 10.2 两个总体的判别分析 244 10.2.1 判别模型 244 10.2.2 正态总体的平均错判成本最小判别法 245 10.2.3 应用实例 247 10.3 多个总体的判别分析 253 10.3.1 后验概率和Bayes公式 253 10.3.2 Bayes判别法 254 10.3.3 平均错判成本最小判别法 255 10.3.4 计算实例 257 10.4 Fisher线性判别分析 262 10.4.1 基本思想 262 10.4.2 Fisher线性判别函数 263 10.4.3 计算实例 266 10.4.4 MATLAB的判别分析函数 270 10.5 逻辑回归模型 271 10.5.1 基本思想及数学模型 271 10.5.2 模型参数估计 272 10.5.3 利用逻辑回归模型分类 273 10.5.4 假设检验 274 10.5.5 应用实例 275 10.6 多分类的softmax回归模型 278 10.6.1 模型与参数估计方法 278 10.6.2 应用实例 279 拓展阅读建议 281 第10章习题 281 第11章 典型相关分析 284 11.1 概述 284 11.2 数学模型及求解 285 11.2.1 数学模型 285 11.2.2 模型求解 286 11.2.3 典型相关系数的显著性检验 289 11.3 MATLAB实现及应用实例 289 11.3.1 MATLAB实现 289 11.3.2 应用实例 293 拓展阅读建议 295 第11章习题 296 附录A 2分布、t分布和F分布 298 附录B 多元正态总体参数的极大似然估计 305 附录C 顺序统计量和经验分布函数 309 C.1 顺序统计量 309 C.2 经验分布函数 311 附录D 矩阵函数的求导公式 317 部分习题答案 321 参考文献 336