前言
  
  
  
  
背景
  随着现代医学及技术的迅速发展,生物医学海量数据日益激增,医学工作者将面临如何对来自临床实践及基础实验研究中的数据进行正确的统计分析并提取特征信息,从而用于临床研究、诊断和治疗。当前,对于大部分医学生及医学工作者,基础统计分析及SPSS软件实现已经普及,对于从临床实践及基础实验研究中所获取的数据进行基本统计分析的过程也已经掌握。但是,基础统计分析提取的信息较为有限,距研究者的期望相去甚远。许多研究实践证实,采用高级统计分析方法以及高维数据的数据挖掘技术可以提取更多更有价值的信息,相应的研究结果被业界广泛认同。但是,当前医学生及医学工作者对这些数据分析知识缺乏了解,这一方面造成了大量宝贵的基础实验数据、临床研究数据处于闲置无用的状态,另一方面也无助于医学知识的有效积累、无助于提升临床诊治的精准度。近年来作者一直致力于生物医学数据深度挖掘方面的研究,同时为众多医学研究生、青年医师、医学工作者提供高级统计分析服务。在与医学研究生及医学工作者的接触过程中,我们深深体会到目前临床与基础医学研究中的海量数据存在着进一步深度挖掘的空间。因此,我们一直抱有将我们近20年来的研究与教学工作的经验与大家分享的动机。
目的
  为了提高广大医学生和医学工作者对于数据深度分析及数据挖掘的能力,本书介绍一些高级统计分析方法,如多元回归分析、主成分分析、生存分析、Meta分析,以及针对高维数据的数据挖掘技术,如决策树模型、支持向量机、随机森林分类、关联规则等。除了重点介绍近年来新出现的医学数据分析方法及数据挖掘技术外,也重点描述、示范这些方法的软件实现的具体内容。
特色
  (1)内容覆盖面广:内容涉及常见的复杂医学数据分析及数据挖掘,如主成分分析、生存分析、倾向性匹配、决策树模型、支持向量机和关联规则分析等,从而拓展了读者的知识面;
  (2)案例典型、完备、翔实:以疾病或系统为主线,采用案例式编排,深入浅出地帮助读者熟悉复杂数据的分析处理的各种方法,增强可读性与针对性;
  (3)软件实现具体细致:展示问题分析和解决的流程及相应的软件操作实现,避免大量的公式及烦琐的计算,提高实用性与可操作性;
  (4)数据处理经验、研究成果的结晶:分享作者在长期从事医学数据处理工作中积累的丰富的基础临床医学数据处理经验和研究成果。
读者对象
  本书适合作为医学院校本科生及研究生教材,也可作为医学基础科研及临床科研工作者及相关技术人员科学研究的参考用书。
  本书主要取材于编者近年来从事生物医学数据深度挖掘方面的研究与教学工作内容,部分数据资料在与临床医生探讨后进行了改编。在此向曾经与我们分享研究过程的医生朋友们表示由衷的感谢,向参与过讨论的研究生表示感谢。我们还要感谢北京市自然科学基金项目(No. 7142015)的支持。
再版
  本书第1版自出版以来,得到了广大医学生和医学工作者的肯定,被很多医学类院校选用为教材,同时也被一些科研培训班选用为数据挖掘类培训教材。考虑近年来新的医学数据挖掘方法层出不穷,并在临床医学和基础医学研究中有潜在的应用价值,因此本书在第2版中补充了相应的内容,增加了Logistic回归诺莫图的绘制、决策曲线分析、Cox回归诺莫图的绘制、偏AUC分析、系统聚类图的各类图形展示,及决策树回归、网络Meta分析、偏最小二乘判别分析和Lasso回归等内容,并仍以案例的形式详细讲解如何应用R软件操作实现。
  在本书的编写之初和编写过程中得到了诸多同行的鼓励和全力支持,借此机会向他们表示深深的敬意和由衷的感谢。同时也感谢首都医科大学生物医学工程学院领导的大力        支持。
  本书虽然由编写动机到成书历经时间不短,但全新取材工作量巨大和具体编写时间有限,加之编者水平和所涉猎范围所限,书中不足和缺陷在所难免。希望得到专家、同行和读者的批评指正,以使本书不断完善。
  
                                                                   编者
                                                               2023年3月

IV
医学数据挖掘案例与实践(第2版)
  
V
前言