第5章决策支持系统——信息价值的发现者 本章学习目标 认识决策对于成败的影响,以及决策的相关性质。 了解决策支持系统及其产生与发展过程,以及结构和类型。 了解决策支持系统的相关技术,主要是支持数据分析和挖掘的技术。 理解传统的智能决策支持系统和新的智能决策支持系统的特点和结构。 广东国税局税务分析与决策支持系统 随着电子政务系统的发展以及税务信息化程度的不断提高,税务决策支持方面也不断吸纳新的信息处理技术、提高决策的科学性和规范性,成为提高行政办公效率、促进经济发展的关键所在。广东省国税局自“科技兴税”战略实施以来,信息化工作在网络建设、设备配置、应用系统开发应用等方面已逐步得到完善; 金税工程、统一征管软件、出口退税、公文管理、人事管理等应用系统都已推广应用多年,具备一定的应用规模和应用深度,并取得了较好的应用效果。 广东国税的业务系统在满足日常税收业务需求的同时也采集了大量业务数据。例如,每年采集2000多万份的申报数据和2000多万份的税票数据,其中出口专用税票数据达100多万份。这些业务数据的背后隐含了十分丰富的信息和规律,也给税务信息化建设带来一些问题,主要体现在: 业务数据分散在不同的应用系统中,数据共享度低且格式不统一; 数据太多而信息太少; 缺乏快速、高效、便捷的获取信息的工具; 基层单位的管理手段日益先进,而上级管理机关却仍然停留在以汇报和检查为主的传统管理模式上; 上级管理部门没有或只有很少信息,上下级税务机关形成信息不对称。 为进一步加强税务信息化建设,实现对税收业务和纳税人的纳税情况进行科学分析,为管理决策提供及时准确的信息,以进一步加强税收管理、加强业务监控、促进依法治税,广东省国税局提出建设税务分析与决策支持系统。该系统作为国家税务总局关于税务信息化“一个网络、一个平台、四个系统”总体规划的重要组成部分,其目标在于通过建立规范统一、高度共享的综合性主题数据库,并在此基础上,建设一个能够对事物(如税收收入)的规模、构成、分布、发展速度、平均水平、平衡程度等特征及增长变化规律和发展趋势,以及事物之间(如GDP与税收收入)的相关关系、强度及均衡性等问题进行分析的平台。 菲奈特软件公司的税务分析与决策支持系统(BI.TAXATION)全面满足了广东省国税局的需求。该系统建立在商业智能平台——BI.Office上,应用数据仓库、OLAP分析和数据挖掘等技术,可以实现税收宏观分析、税收收入分析、税收征管分析、出口退税分析、专用发票分析、纳税人分析、纳税人审计分析等功能。它可以对经济和税收综合数据进行科学分析,研究经济与税收增长的弹性、发展的均衡性等数量关系,揭示税收收入和税收负担等重大指标的长期增长趋势、波动规律、发展速度、地区分布、行业分布、所有制分布和月度时序特征; 运用对比分析方法揭示事物之间的关系、强度及均衡性; 对税收收入、出口及出口退税等重大税收指标进行精确监控和科学预测; 根据纳税人的生产经营情况和纳税情况对其申报的真实性进行量化评测和科学分类。 由于菲奈特软件公司税务分析与决策支持系统能够同时适应省局和各市局的要求,广东省国税系统被全面推广使用。广东省国税局相关负责人认为: 菲奈特软件公司的税务分析与决策支持系统有助于全面提高税务决策的科学性和规范性,增强税收对国民经济的杠杆作用; 并加强业务监管力度,有效地打击偷漏税违法行为,从而极大地提高广东国税的税收管理水平。 广东国税税收分析与辅助决策系统的解决方案由以下产品组成: (1) 数据仓库产品——ORACLE8I(9I); (2) OLAP服务器(多维数据库)——ESSBASE OLAP SERVER (IBM OLAP SERVER); (3) 应用服务器——IBM WEBSPHERE APPLICATION SERVER; (4) 前端展示软件——BI.OFFICE 3.0; (5) 主机系统——IBM RS/6000M85 (4CPU/8GBRAM)。 税务分析与决策支持系统应用于税务局税务分析领域。BI.Office是菲奈特软件公司成功自主开发的基于企业业务数据库的商业智能应用开发平台。BI.Office建立在传统的业务系统上,面向企业决策层和综合管理层,提供综合决策支持、风险评估、预警系统和相关企业事务管理系统,是企业信息化的高层应用; 同时,它可以全面地分析企业信息,为企业发现潜在的商机,寻找隐藏的客户消费规律,监控企业潜在的风险。 税务分析与决策支持系统所发挥的作用: 税收决策支持系统提供查询统计、综合分析、业务预警、税收预测。以查询、分析、报表一体,三者不断循环深入为手段,提供多角度的税收数据查询、分析、预警、预测功能。 决策是主导企业成败的关键,而支持企业决策的工具——决策支持系统,对企业的决策形成强有力的支撑。 5.1决策——成败的关键 我有一笔资金,是吃利息,还是投资?是投资股票还是投资债券?大学(或硕士)毕业,继续求学还是就业谋生?我今天很困,是去上课还是在宿舍睡懒觉?采取何种治疗方式?喝哪种口味的咖啡?生活就是由一系列决策组成的。每天,人们都会面对海量信息的轰炸,并且不得不做出各种大大小小的决策。人生充满不确定性,人们无时无刻不在决策。在棋界有句话: “一着不慎,满盘皆输; 一着占先,全盘皆活。”它喻示一个道理,无论做什么事情,成功与失败取决于决策的正确与否。 5.1.1决策决定成败的案例 组织运作过程中常常会遇到许多决策问题,如企业采购原材料时应该选择哪家供应商?如何根据客户的信用度,确定是否给予贷款?怎样确定合理的库存量?如何选择最佳运输路径?如何确定明年的产品需求量?连锁门店应该选在什么位置比较合适?人们常常把解决以上问题的过程称为决策。有人说“细节决定胜败”,有人说“执行决定成败”……殊不知,一个企业的决策错了,无论以后的细节做得多么完美,执行得多么到位,等待它的结果都是一样的,那就是失败。决策决定成败,只有决策正确,细节和执行才有意义可言。 什么是决策?狭义的决策就是在几种行动方案中进行选择,即人们为了达到一定目标,在掌握充分的信息和对有关情况进行分析的基础上,用科学的方法拟定并评估各种方案,从中选出合理方案的过程。广义的决策还包括在做出选择之后采取行动的一切活动。过去认为决策是叫“咱说了算”,实际上并不是那么简单。 企业或组织更是时刻都有决策发生,决策不总是成功的,失败的案例也比比皆是。日本尼西奇公司在第二次世界战后初期,仅有30余名职工,生产雨衣、游泳帽、卫生带、尿布等橡胶制品,订货不足,经营不稳,企业有朝不保夕之感。公司董事长多川博从人口普查中得知,日本每年大约出生250万婴儿,如果每个婴儿用两条尿布,一年就需要500万条,这是一个相当可观的尿布市场。多川博决心放弃尿布以外的产品,把尼西奇公司变成专业尿布公司,集中力量,创立名牌,成了“尿布大王”。资本仅1亿日元,年销售额却高达70亿日元。企业经营决策成功,可以使企业避免倒闭的危险,转败为胜。如果企业长期只靠一种产品去打天下,势必潜藏着停产倒闭的危险,因为市场是多变的,人们的需要也是多变的,这就要求企业家经常为了适应市场的需要而决策新产品的开发。这种决策一旦成功,会使处于“山穷水尽”状况的企业顿感“柳暗花明”。科学的企业决策能使企业充满活力,兴旺发达,而错误的决策会使企业陷入被动,濒临险境。黄河中游重要支流渭河变成悬河,多次发生水灾,沿岸民众受害不浅。学界早已公认其祸首就是三门峡水库,由于设计上的缺陷,使得水库发电和上游泥沙淤积之间形成了尖锐矛盾。近年,政府开始承认在三门峡建设中存在重大的决策失误,然而由于决策失误所造成的日益恶化的环境问题,早已超出了经济所能涵盖的范围。再看看广州市某知名面粉厂的原料库存管理案例。该厂一贯非常重视原料采购管理,早年已引入了ERP管理,每个月都召开销—产—购联席会议,制订销售、生产和原料采购计划。采购部门则“照单抓药”,努力满足生产部门的需要,并把库存控制在两个月的生产用量之下,明显地降低了原料占用成本。但是,从2015年下半年开始,国内外的小麦价格大幅度上涨,一年内涨幅接近30%,而由于市场竞争激烈,面粉产品的价格不能够同步提高,为了维持经营和市场占有率,该厂不得不一边买较高价的原料,一边生产销售相对低价的产品,产销越多,亏损也越厉害,结果当年严重亏损。 决策与经济效果息息相关。英国著名的世界经济调查机构朗莱弗公司公布的对“智力”和“效益”的测定数据表明: 企业增加一个劳动力,可以取得1∶1.5的经济效果; 增加一个技术人员,可以取得1∶2.5的经济效果; 而增加一个高层决策者,则可以取得1∶6的经济效果。 看如下故事案例: 有三个人要被关进监狱三年,监狱长允许他们三个人一人提出一个要求。美国人爱抽雪茄,要了三箱雪茄。法国人最浪漫,要一个美丽的女子相伴。而犹太人说,他要一部与外界沟通的电话。三年过后,第一个冲出来的是美国人,嘴里鼻孔里塞满了雪茄,大喊道: “给我火,给我火!”原来他忘了要火了。接着出来的是法国人。只见他手里抱着一个小孩子,美丽女子手里牵着一个小孩子,肚子里还怀着第三个。最后出来的是犹太人,他紧紧握住监狱长的手说: “这三年来我每天与外界联系,我的生意不但没有停顿,反而增长了200%,为了表示感谢,我送你一辆劳斯莱斯!”这个故事告诉人们,什么样的选择决定什么样的生活。今天的生活是由三年前的选择决定的,而今天的选择将决定三年后的生活。人们要选择接触最新的信息,了解最新的趋势,从而更好地创造自己的未来。 企业要成功,一要正确决策,二要科学管理。这是企业成功的导向和关键,也是企业最重要的基础性建设和硬功夫。在企业的各项管理中,诸如决策、进销货、财务、费用、资产、用工、人才等管理,决策管理是最重要的管理,千万不可忽视。诺贝尔经济学奖获得者、著名管理大师赫伯特·西蒙说: “决策是管理的心脏,管理是由一系列决策组成的,管理就是决策。决策的正确与否,决定着组织发展的盛衰,关系到组织的生死存亡,是‘生死之地,存亡之道’”。决策是企业做任何事的第一步,同时也是最关键的一步。决策失误,是最大的失误。尤其是重大决策,一旦失误,会给企业带来无可估量的损失,甚至还可能是灭顶之灾。据世界著名咨询公司美国兰德公司统计,世界上每1000家破产倒闭的大企业中,85%是因为企业管理者的决策不慎造成的。 5.1.2决策及分类 决策指为实现某一目标,从若干可以相互替代的可行方案中选择一个合理方案并采取行动的分析判断过程,即决策是人们为实现一定的目标而制订行动方案,进行方案选择并准备方案实施的活动,是一个提出问题、分析问题、解决问题的过程。正确理解决策概念,应把握以下3层意思: (1) 决策要有明确的目标。决策是为了解决某一问题,或是为了达到一定目标。确定目标是决策过程的第一步。决策所要解决的问题必须十分明确,所要达到的目标必须十分具体。没有明确的目标,决策将是盲目的。 (2) 决策要有两个以上备选方案。决策实质上是选择行动方案的过程。如果只有一个备选方案,就不存在决策的问题。因而,要有两个或两个以上方案,人们才能从中进行比较、选择,最后选择一个满意方案作为行动方案。 (3) 选择后的行动方案必须付诸实施。如果选择后的方案,束之高阁,不付诸实施,决策也等于没有决策。决策不仅是一个认识的过程,也是一个行动的过程。 决策是人们在政治、经济、技术和日常生活中普遍存在的一种行为; 决策是管理中经常发生的一种活动; 决策是决定的意思,它是为了实现特定的目标,根据客观的可能性,在占有一定信息和经验的基础上,借助一定的工具、技巧和方法,对影响目标实现的诸因素进行分析、计算和判断选优后,对未来行动做出决定。 1. 结构化决策、非结构化决策和半结构化决策 决策按照其性质可以分为结构化决策、非结构化决策和半结构化决策,3种决策的含义如下: (1) 结构化决策,是指对某一决策过程的环境及规则,能用确定的模型或语言描述,以适当的算法产生决策方案,并能从多种方案中选择最优解的决策; (2) 非结构化决策,是指决策过程复杂,不可能用确定的模型和语言来描述其决策过程,更无所谓最优解的决策; (3) 半结构化决策,是介于以上二者之间的决策,这类决策可以建立适当的算法,产生决策方案,使决策方案得到较优的解。 非结构化和半结构化决策一般用于一个组织的中、高管理层,其决策者一方面需要根据经验进行分析判断; 另一方面也需要借助计算机为决策提供各种辅助信息,及时做出正确有效的决策。 2. 战略决策、战术决策和业务决策 按照决策范围,可以把决策分为战略决策、战术决策和业务决策。 战略决策是指直接关系到组织的生存和发展,涉及组织全局的长远性的、方向性的决策。一般需要长时间才可看出决策结果,所需解决问题复杂,环境变动较大,并不过分依赖数学模型和技术,定性定量并重,对决策者的洞察力和判断力要求高。战术决策又称管理决策,是组织内部范围贯彻执行的决策,属于战略决策过程的具体决策。战术决策不直接决定组织命运,但会影响组织目标的实现和工作效率的高低。业务决策又称执行性决策,是日常工作中为了提高生产效率、工作效率所做的决策。业务决策涉及范围小,只对局部产生影响。三者相辅相成,构成紧密联系、不可分割的整体,是指导与被指导的关系,地位不同,特点不同。 战略决策和战术决策的主要区别如下: (1) 从调整对象来看,战略决策调整组织的活动方向和内容,解决“做什么”的问题,是根本性决策; 战术决策调整在既定方向和内容下的活动方式,解决“如何做”的问题,是执行性决策。 (2) 从涉及的时间范围来看,战略决策面对组织整体未来较长一段时期内的活动,而战术决策则是具体部门在未来各个较短时间内的行动方案。战略决策是战术决策的依据,战术决策是在战略决策指导下制定的,是战略决策的落实。 (3) 从作用和影响上来看,战略决策的实施效果影响组织的效益与发展,战术决策的实施效果则主要影响组织的效率。 3. 程序化决策和非程序化决策 企业决策的内容和性质不一样,所能运用的决策方法也就不能相同。犁地要用犁,收麦要用镰刀。而决策又不能不运用一定的方法,并且就像犁地和收麦要有效率就必须分别借助犁和镰刀一样,不同的决策必须选用不同的决策分析方法。企业的决策,从决策的方式方法来看,可以分为性质完全不同的两种决策: 程序化决策和非程序化决策。 1) 程序化决策 程序化决策是可以根据既定的信息建立数学模型,把决策目标和约束条件统一起来,进行优化的一种决策。例如工厂选址、采购运输等决策。这种决策是可以运用运筹学技术来完成的。在程序化决策中,决策所需要的信息都可以通过计量和统计调查得到,它的约束条件也是明确而具体的,并且都是能够量化的。对于这种决策,运用计算机信息技术可以取得非常好的效果。通过建立数学模型,让计算机代为运算,并找出最优的方案。程序化决策都是在价值观念之外做出的,至少价值观念对这种决策的约束作用不是主导因素。 2) 非程序化决策 非程序化决策所赖以进行的信息不完全,变量之间的关系模糊、不确定。约束条件是由各种各样的社会发展变量,例如社会需求、消费偏好、个人收入、消费习惯等之间的关系构成的。社会发展变量的不确定性制约着约束条件的稳定性。加之这种决策的贯彻实施还会引起决策所影响对象的有意识反应,例如竞争对手采取与之相对应的措施。这就导致决策与决策实施结果之间关系的进一步复杂化。这种决策,是无法通过建立数学模型来为决策人制定决策提供优化方案的。在这种决策中,变量更多的是人的意志因素。而人又是一个奇怪的存在物,他的意志和欲望多种多样,并且各自的评价又不同。所以,这种决策就不是一种可以在数理基础上完成的逻辑选择。 表51是程序化决策与非程序化决策在不同组织中的例子。 表51程序化决策与非程序化决策在不同组织中的例子 决 策 种 类问题解 决 程 序例子 程序化决策重复的 例行的各种规则 标准的运营程序企业: 处理工资单 大学: 处理入学申请政策 医院: 准备诊治病人 政府: 使用国产汽车 非程序化决策复杂的 新的创造性问题 解决方式企业: 引入新的产品 大学: 建立新的教学设施 医院: 对地方疾病采取措施 政府: 解决通货膨胀问题 4. 确定型决策、风险型决策和不确定型决策 按决策环境不同,决策可分为确定型决策、风险型决策和不确定型决策,如图51所示。 图51依据决策环境分类 (1) 确定型决策: 采取一种方案时,只有一种后果(自然状态变量只有一种取值)。 (2) 风险型决策: 采取一种方案时,有多种可能的后果,自然状态变量取值的概率可以估计(自然状态变量取值不唯一)。 (3) 不确定型决策: 采取一种方案时,有多种可能的后果,但取值不唯一的自然状态变量的概率值不可估计(可能源于信息不充分等)。 5. 群体决策和个体决策 从决策主体看,决策可以分为群体决策和个体决策。 个体决策又称个人决策,决策者是单个人,因而也称为首长决策,是指在选定最后决策方案时,由最高首长最后做出决定的一种决策形式。个体决策的特点是决策迅速、责任明确,而且能够发挥首长个人的主观能动性,但受领导个人自身的性格、学识、能力、经验、魄力等的制约。群体决策指由两个或两个以上的人组成的决策集体所做出的决策。群体决策的一个主要优点是群体通常能够比个体做出质量更高的决策。有证据表明,群体能做出比个人更好的决策。效果以速度来定义,个体决策较优越; 效果以创造性程度来定义,群体决策较优越; 效果以最终决策的接受程度来定义,群体决策较优越。从消耗的工作时间来看,群体决策的效率低。在决定是否采用群体决策时,必须考虑: 其决策质量和可接受性的提高是否足以抵消决策效率方面的损失。群体决策的优势和劣势如表52所示。 表52群体决策的优势和劣势 优势劣势 知识、信息的更大集中抑制个人创造 不同观点、不同角度看决策环境意见分散、难以集中 更好地了解决策互相吹嘘 决策更能使人接受目标转移,花费更多时间 训练基地集体思维,限制理性判断 6. 更多的决策分类 决策按管理过程可以分为计划决策、组织决策、领导决策和控制决策; 按管理领域可以分为财务决策、人事决策、生产决策、营销决策和库存决策; 按决策目标和决策变量等是否可以用数值来表示分为定性决策(经验思维法、逻辑思维法、直觉思维法)和定量决策(数学化、模型化、计算机化)。 5.1.3了解决策 决策是复杂的,只有从多个角度来分析它,才能更深入地了解它。下面来看看决策与管理、决策与信息间的关系,了解决策的程序、方法和决策的艺术性。 1. 决策与管理 不能将决策和日常管理混淆,决策是最高端的管理活动,它立于管理体系的金字塔顶端。决策与日常管理判若云泥,举一个最简单的例子: 什么是人事管理和人才决策呢?人事管理就是招聘员工,让他做好本职工作,并对其业绩、能力和优缺点进行评估、奖惩。可什么是人才决策呢?人才决策的第一要务是做好授权管理; 第二要务是用人之长,而非补其短; 第三是继任者选拔与培养,为基业长青提出智力保障。决策就是“做正确的事”,而日常管理则是“正确地做事”,两者有本质的区别。“南辕北辙”的故事大家都听过,可是很多企业却在重复着这种笑话,关键就是因为决策者失职了——他没有掌控好企业的战略方向。 管理工作的好坏、成就的大小关键取决于决策的正确与否。管理就是对人或事的管辖和处理的组织活动,具有自然属性和社会属性,具有计划、组织、指挥、控制和协调5个职能; 决策是有决策权的领导者的择优行为,与决定相比,具有目标性、预测性、择优性、实践性特点; 正确的决策要有正确的理论指导,要全面真实地掌握信息,要按一定的程序进行,要求水平较高的领导者,要实行民主和群众决策,要使用先进的方法与技术,保证决策的正确性、优化性,从而进行有效管理。 西方决策理论学派的代表人物赫伯特·西蒙(Herbert Simon)认为: 管理就是决策,决策是管理的核心。没有决策就没有合乎理性的行为,从这个意义上说,管理即是决策,管理的核心是决策,管理的首要职能也是决策,决策渗透于管理的所有职能中。管理中有如下决策问题: 什么是组织的长远目标?采取什么策略来实现组织目标?组织的短期目标是什么?组织资源如何配置?如何对待积极性不高的员工?在一定的环境中采用何种领导方式为好?需要招聘多少人员?工作如何分配?权利如何分配?采用何种组织形式?组织中哪些活动需要控制?决策对企业决策者(企业家)的能力要求是快速判断、快速反应、快速决策、快速行动及快速修正。决策能力是企业家为维持企业生存必须具备的、最起码素质,科学决策是企业家知识素质的综合体现,也是他们的主要工作。 2. 决策程序 决策的一般程序如下。 (1) 确定决策目标。决策目标是指在一定外部环境和内部环境条件下,在市场调查和研究的基础上所预测达到的结果。决策目标是根据所要解决的问题来确定的,因此,必须把握住所要解决问题的要害。只有明确了决策目标,才能避免决策的失误。 (2) 拟定备选方案。决策目标确定以后,就应拟定达到目标的各种备选方案。拟定备选方案,第一步是分析和研究目标实现的外部因素和内部条件、积极因素和消极因素,以及决策事物未来的运动趋势和发展状况; 第二步是在此基础上,将外部环境各不利因素和有利因素、内部业务活动的有利条件和不利条件等,同决策事物未来趋势和发展状况的各种估计进行排列组合,拟定出实现目标的方案; 第三步是将这些方案同目标要求进行粗略的分析对比,权衡利弊,从中选择出若干个利多弊少的可行方案,供进一步评估和抉择。 (3) 评价备选方案。备选方案拟定以后,随之便是对备选方案进行评价,评价标准是看哪一个方案最有利于达到决策目标。评价的方法通常有经验判断法、数学分析法和试验法。 (4) 选择方案。选择方案就是对各种备选方案进行总体权衡后,由决策者挑选一个最好的方案。 (5) 执行方案。任何方案只有真切地得到实施后才有其实际的意义,执行方案是决策的落脚点。 (6) 回馈评估方案。通过对决策的追踪、检查和评价,可以发现决策执行的偏差,以便采取措施对决策进行控制。 下面通过三星公司的成长经历了解决策的一般过程。 案例: 三星的成长经历与决策过程 1996年夏天,三星在韩国之外几乎无人知晓,从设计上看,其产品无非是对强势品牌的拙劣模仿,除了价格优势外几乎无可圈可点之处。1996年元旦,李健熙在新年致辞中宣布把当年定为三星的“设计革命年”,启动多项设计项目来推动三星的增长。 分析: 从管理上看,这里包括一个决策过程。 (1) 诊断问题。三星品牌少有顾客问津,货架上的产品已经落了一层灰,三星在西方市场只被视为廉价的二流产品。 (2) 明确目标。三星野心勃勃,立志要成为全球前五强。 (3) 拟订方案。李健熙将三星的战略核心定义为设计,他认为出色的设计将是促使三星跻身世界一流品牌的一剂猛药。 (4) 筛选方案。确立了新战略之后,三星特别邀请日本设计大师福田民郎对其品牌定位、生产过程及产品进行考察,其结论证实了李健熙的想法——设计才是三星成功的关键。 (5) 执行方案。三星在确立了目标和筛选好方案之后,管理者即董事长李健熙设法将执行方案所需的足够数量和种类的资源调动起来,并注意不同种类资源的互相搭配,以保证方案的顺利执行。鼓励员工一起努力,认真给员工贯彻要进行“设计”“创新”的重要性,带领员工一起提早上班以彰显决心。给员工支持的同时,还充分调动他们的积极性。保证责权利三者的有效结合,确保方案朝着管理者所期望的路线演进。三星创办了自己的设计学院“创新设计实验室”(IDS),由美国设计师Gordon Bruce和James Miho主管,为公司培养适应全球化需要的设计人才。三星还通过在东京、旧金山和伦敦成立设计中心来打造全球设计网络。三星的韩国设计师也被派往全球各地的分支机构,与当地员工共同完成为时数周至半年的交流项目。 (6) 评估效果。2007年,三星超过对手索尼(26位)、摩托罗拉(69位)和LG电子(94位),排名第20。 3. 决策方法 决策是人类社会自古就有的活动,真实的决策是混乱、复杂的,但是决策者却是普通的和平凡的。虽然决策者有丰富的经验和阅历,可面对全新的问题时,这些经验和阅历可能会让决策变得更加云遮雾绕。而且,单靠决策者的大脑永远无法获得和处理决策事项的所有资料,要在不确定的情况下做出选择,又必须保证有效(effective),这种矛盾的处境,需要决策者不断反思,事先做好决策准备,并且在现代化方法或工具的支持下做出合理的决策。 决策科学化是在20世纪初开始形成的。第二次世界大战以后,决策研究在吸引了行为科学、系统理论、运筹学、计算机科学等多门科学成果的基础上,结合决策实践,到20世纪60年代形成了一门专门研究和探索人们做出正确决策规律的科学——决策学。决策学研究决策的范畴、概念、结构、决策原则、决策程序、决策方法、决策组织等,并探索这些理论与方法的应用规律。 要做到最有效决策,需要满足最优决策的条件: 充分了解所有信息; 要了解辨识并制订毫无疏漏的方案; 准确有效地计算未来的执行结果。决策遵循的是满意原则,而不是最优原则。原因是: 组织内外的发展与变化会直接或间接影响相关信息收集; 只能收集到有限信息; 制订的方案数是有限的,对有限方案的认识是有局限性的; 任何方案的实施都在未来,而未来是不确定的。 在有些情形下,管理者最有可能使用直觉决策的方法,如: 存在高不确定性时; 极少有先例存在时; 变化难以科学地预测时; 事实不足以明确指明前进道路时; 分析性数据用途不大时; 当需要从几个可行方案中选择一个,而每一个评价都良好时; 时间有限,并且存在提出正确决策的压力时。 4. 决策与信息 决策离不开信息,信息的数量和质量直接影响决策水平。收集数据、处理数据、产生信息的成本应低于信息所带来的效益。有这样一句管理名言: 科学的信息是90%的信息+10%的决断。美国决策理论学派创始人赫伯特·西蒙认为,决策的关键是时机和信息,如果没搞清情况,就匆忙决策,很容易导致决策失误。 5. 决策的艺术性 决策具有艺术性的一面,主要是因为: (1) 决策的对象是软系统,是包含“人、事、物”的复杂系统,无法彻底了解其内部规律和工作原理。 (2) 决策系统处于软环境之中,无法全面了解和准确预测。 (3) 决策的方案是软方案。 (4) 决策结果的评价是软评价——谁优谁劣难以定夺,同一结果见仁见智。 5.2决策支持系统——全力帮你决策 因为决策影响企业成败,决策支持系统与事务处理系统相比,往往带着巨大的光环,决策支持系统到底如何工作,具有什么样的特征、结构和分类,是帮你决策还是代替你做决策,这是本节主要涉及的问题。 5.2.1决策支持系统及其产生发展 管理者虽然可以通过TPS获得经过分类、比较、汇总和简单计算后产生的信息,但是这些信息对于制定某些特殊问题决策的支持力度是不够的,以至于只能靠直觉、经验进行决策。为了满足完成复杂决策问题的要求,决策支持系统应运而生。以下从决策支持系统的定义、特征、产生发展和应用4方面介绍决策支持系统。 1. 决策支持系统的定义 决策支持系统(Decision Support System,DSS)的概念于20世纪70年代初由迈克尔·斯科特·莫顿(Michael S.Scott Morton)在《管理决策系统》一文中首次提出,20世纪80年代中期引入我国。 决策支持系统是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。 决策支持系统的概念最初是由迈克尔·斯科特·莫顿和高瑞(Gorry)整合了安东尼(Anthony)对管理行为的分类和西蒙(Simon)对决策类型的描述而提出的。安东尼将管理行为描述为策略制订(对于总体任务目标的行政级决策)、管理控制(管理组织运营的中层管理)、操作管理(指导特定任务的一线监管); 西蒙将决策问题描述为存在于连续体上的可程序化问题(常规的、重复的、结构化的、易解决的)和不可程序化问题(新型的、非结构化的、难以解决的)。斯科特·莫顿和高瑞根据以上两种思想,使用结构化、非结构化、半结构化3个术语来代替可程序化与不可程序化,同时采用了西蒙对决策过程的智能、设计和选择的描述。在这个框架中,智能是由对问题的搜索所组成的,设计则指的是分析可选方案并确定一个实施。此时DSS被定义为主要解决半结构化和结构化问题的计算机系统。一个计算机系统虽然可以用来解决DSS中的结构化问题,然而,决策者的判断主要依靠的是非结构化的部分。将其组合起来,就成为了一个用来解决实际问题的人机系统。 DSS是一个融计算机技术、信息技术、人工智能、管理科学、决策科学、心理学、行为科学和组织理论等学科与技术于一体的技术集成系统。随着其他学科的不断发展,尤其是计算机技术和信息技术的巨大进步,DSS作为新的交叉学科,将会随着其他技术的迅速发展而产生突破性进展。 2. 决策支持系统的特征 决策支持系统的一般特征如下: (1) 主要用来解决半结构化和非结构化问题。 (2) 面向组织的所有管理层特别是高层和中层的管理人员。 (3) 用于辅助决策,而不是代替决策者决策。 (4) 支持决策制定的全过程(情报、设计、选择和实施四阶段)。 (5) 注重提升决策的效能,而不是效率。 (6) 强调由非计算机人员(管理者)以交互会话的方式方便地使用DSS。 (7) 把模型、分析、人工智能与数据库、数据仓库和数据挖掘技术结合起来。 (8) 可以为个人、群体和团队的决策提供支持。 (9) 偏好于图形输出。 (10) 系统的运行是由它的使用者控制的。 下面对一般特征中的个别特征做出解释和说明。 系统只是支持用户而不是代替他判断。因此,系统并不提供所谓“最优”的解,而是给出一类满意解,让用户自行决断。同时,系统并不要求用户给出一个预先定义好的决策过程。 系统所支持的主要对象是半结构化和非结构化的决策(不能完全用数学模型、数学公式来求解)。它的一部分分析可由计算机自动进行,但需要用户的监视和及时参与。 采用人机对话的有效形式解决问题,充分利用人的丰富经验,计算机的高速处理及存储量大的特点,各取所长,有利于问题的解决。 决策支持系统强调的是对管理决策的支持,而不是决策的自动化,它所支持的决策可以是任何管理层次上的,如战略级、战术级或执行级的决策。 总之,随着DSS的技术和理论不断发展,从其发展趋势可以认识到: 决策支持系统是专门为高层管理人员服务的一种信息系统,它强调支持的概念是“支持”而不是“代替”人的决策主体。DSS也是一个高度灵活、交互式的计算信息系统,主要解决半结构化、结构化的决策问题。同时DSS也是一个融多种学科知识和技术于一体的集成系统,随着管理理论、行为科学、心理学、人工科学等相关学科的不断发展,尤其是计算机技术、网络技术等现代信息技术的不断发展,DSS的应用研究将不断深入,逐步向着高智能化、高集成化和综合化方向发展,并将深入到社会生活的各个领域,帮助决策者提高决策能力与水平,成为人们决策活动中不可缺少的有力助手,最终实现提高决策的质量和效果的目的。 3. 决策支持系统的产生与发展 自从20世纪70年代决策支持系统概念被提出以来,决策支持系统已经得到很大的发展。 1980年Sprague提出了决策支持系统三部件结构(对话部件、数据部件、模型部件),明确了决策支持系统的基本组成,极大地推动了决策支持系统的发展。 20世纪80年代末90年代初,决策支持系统开始与专家系统(Expert System,ES)相结合,形成智能决策支持系统(Intelligent Decision Support System,IDSS)。智能决策支持系统充分发挥了专家系统以知识推理形式解决定性分析问题的特点,又发挥了决策支持系统以模型计算为核心的解决定量分析问题的特点,充分做到了定性分析和定量分析的有机结合,使得解决问题的能力和范围得到了大的发展。智能决策支持系统是决策支持系统发展的一个新阶段。20世纪90年代中期出现了数据仓库(Data Warehouse,DW)、联机分析处理(OnLine Analysis Processing,OLAP)和数据挖掘(Data Mining,DM)新技术,DW+OLAP+DM逐渐形成新决策支持系统的概念,为此,将智能决策支持系统称为传统决策支持系统。新决策支持系统的特点是从数据中获取辅助决策的信息和知识,完全不同于传统决策支持系统用模型和知识辅助决策。传统决策支持系统和新决策支持系统是两种不同的辅助决策方式,两者不能相互代替,更应该是互相结合。 把数据仓库、联机分析处理、数据挖掘、模型库、数据库、知识库结合起来形成的决策支持系统,即将传统决策支持系统和新决策支持系统结合起来的决策支持系统是更高级形式的决策支持系统,称为综合决策支持系统(Synthetic Decision Support System,SDSS)。综合决策支持系统发挥了传统决策支持系统和新决策支持系统的辅助决策优势,实现更有效的辅助决策。综合决策支持系统是今后的发展方向。 随着DSS应用范围的不断扩大,应用层次的逐渐提高,DSS已进入到区域性经济社会发展战略研究、大型企业生产经营决策等领域的决策活动中,这些决策活动不仅涉及经济活动各方面、经营管理的各个层次,而且各种因素互相关联,决策环境更加错综复杂。对于省、市、县等发展战略规划方面的应用领域,决策活动还受政治、社会、文化、心理等因素不同程度的影响,而且可供使用的信息又不够完善、精确,这些都给DSS系统的建设造成了很大的困难。在这种情况下,一种新型的、面向决策者、面向决策过程的综合性决策支持系统产生了,即智能化、交互式、集成化的决策支持系统(Intelligent, Interactive and Integrated DSS,3IDSS)。 智能化: 决策支持系统在处理难以定量分析的问题时,需要使用知识工程、人工智能方法和工具,这就是决策支持系统的智能化。 交互式: 决策支持系统的核心内容是人机交互。为了帮助决策者处理半结构化和非结构化的问题,认定目标和环境约束,进一步明确问题,产生决策方案和对决策方案进行综合评价,系统应具备更强的人机交互能力,成为交互式系统(Interactive system)。 集成化: 在这种情况下,采用单一的以信息为基础的系统,或以数学模型为基础的系统,或以知识、规则为基础的系统,都难以满足上述这些领域的决策活动的要求。这就需要在面向问题的前提下,将系统分析、运筹学方法、计算机技术、知识工程、人工智能等有机地结合起来,发挥各自的优势,实现决策支持过程的集成化。 由于Internet的普及,网络环境的决策支持系统将以新的结构形式出现。决策支持系统的决策资源,如数据资源、模型资源、知识资源,将作为共享资源,以服务器的形式在网络上提供并发共享服务,为决策支持系统开辟一条新路。网络环境的决策支持系统是决策支持系统的发展方向。 知识经济时代的管理——知识管理(Knowledge Management,KM)与新一代Internet技术——网格计算,都与决策支持系统有一定的关系。知识管理强调知识共享,网格计算强调资源共享。决策支持系统利用共享的决策资源(数据、模型、知识)辅助解决各类决策问题,基于数据仓库的新决策支持系统是知识管理的应用技术基础。在网络环境下的综合决策支持系统将建立在网格计算的基础上,充分利用网格上的共享决策资源,达到随需应变的决策支持。 4. 决策支持系统的应用及其与管理信息系统的关系 自DSS开发以来,与它的理论研究相比,实际应用工作开展得更早,它广泛用于灾害预测和防灾决策、企业生产活动决策、集团经营行为决策、经济形势预测和政策决策中。 在国外,特别是工业发达的西方国家,DSS已经进行实际应用,成为一种正规的、普遍使用的信息系统。成功应用的例子大量出现,其软件和硬件已商品化和通用化。据有关资料统计,国外开发的DSS,有2/3是成功或部分成功的,主要支持企业管理决策活动,不同程度地改善了决策者和信息决策工作人员的素质和行为,为各级主管决策提供了科学的依据。但有1/3的DSS是失败的,其原因一方面是DSS的开发者对主要决策者的决策风格不了解,系统功能与决策者的信息需求不匹配; 另一方面,过于强调模型的作用,复杂的模型和计算使决策者难以理解和接受; 再加上软硬件技术上的困难,导致开发费用大、时间长,使系统的适应性受到限制。 近年来,DSS理论和技术已经传入我国,20世纪80年代软科学的兴起,促进了DSS的研究。软科学的根本任务是为领导决策服务,为各级、各类决策提供科学依据。在软科学的研究中,“发展规划”和“前景预测”在我国取得了明显效果。“在一切失误中,决策的失误是最大的失误”已成为人们的共识。 决策支持系统(DSS)与管理信息系统(MIS)既彼此区别又紧密相关,两者的区别具体可概括为以下几点: (1) 从解决的决策问题来看,MIS支持的是结构化决策,DSS支持的是半结构化决策。 (2) 从面向人员的角度来看,MIS主要面向中层管理人员,是为管理服务的系统;DSS主要面向高层人员,是为辅助决策服务的系统。 (3) 从组成结构来看,MIS是按事务功能综合多个事务处理的电子数据处理系统,DSS是通过多个模型的组合计算辅助决策。MIS是以数据库为基础、以数据驱动的系统; DSS是以模型库系统为基础、模型驱动的系统。 (4) 从采用的技术来看,MIS主要采用数据库技术,其应用主要是大量的数据存取及检索技术和少量的模型分析; DSS则是把模型或分析技术与传统的数据存取技术及检索技术结合起来,更强调分析模型。 (5) 从对信息的处理来看,MIS是对信息的初次加工,主要是对信息汇总、集成,较少产生新的信息; DSS则是对信息的高级处理,主要是对信息的筛选、分类、综合,并选取合适的模型对信息进行再次加工形成新的信息。另外,MIS分析着重于系统的总体信息的需求,输出报表模式是固定的; DSS分析着重于决策者的需求,输出数据的模式是复杂的。 (6) 从追求目标来看,MIS系统追求的是效率,即快速查询和产生报表; DSS追求的是有效性,即决策的正确性。 (7) 从开发过程来看,MIS的开发过程是以数据、功能或对象为中心的; DSS是以数据为基础,模型的建立是开发DSS的核心与难点。 DSS与MIS的联系主要体现在以下几方面: (1) MIS是一个总概念,DSS是MIS发展的高级阶段或高层子系统。把决策看成是管理的职能之一,则DSS就是MIS的一个子系统; 西蒙认为“管理就是决策”,那么DSS就是MIS发展的高级阶段。从发展的观点看,可以将DSS看作MIS的高级阶段或高层分系统。但为了有利于做深入的专门研究,为了满足组织管理决策现代化与科学化的迫切需要,针对性地做DSS的专门开发与应用也是可行的。 (2) DSS和MIS有相似的界面,都是建立在信息技术基础之上的,都强调与先进的管理思想相结合。对用户而言,二者的实质都是管理软件。 (3) DSS与MIS目标一致,起点不同。DSS的目标是MIS本来就要追求的目标之一,只是这个目标的具体实现是在DSS的名义之下而已。 (4) DSS是不会将MIS取而代之的。这就好像一个组织中不可能只有决策者,还需要有管理者和执行者; 否则,组织就是一个光杆司令,完成不了任何事情。MIS和DSS各自代表了信息系统发展过程中的某一阶段,至今它们仍各自不断地发展着,而且是相互交叉的关系。MIS是面向管理的信息系统,DSS是面向决策的信息系统。DSS在组织中可能是一个独立的系统,也可能作为MIS的一个高层子系统而存在。 5.2.2决策支持系统的结构 尽管DSS在形态上各色各样,但它们在结构上有一个基本特征——集成性,对不同形态的DSS进行分解时,又会发现DSS主要由5个部件组成: 人机接口、数据库、模型库、知识库、方法库。每个库又带有各自的管理系统,即数据库管理系统、模型库管理系统、知识库管理系统、方法库管理系统(如图52所示)。因此一般来说,大部分DSS都可以认为是这十个基本部件的不同的集成和组合,即这十个部件可以组成实现支持任何层次和级别的DSS系统。这种结构被当前大多数DSS所采用。 20世纪80年代开始,随着计算机集成制造系统(CIMS)概念的提出,人们对DSS结构的理解发生了一些变化。Bonczek等人提出,DSS是由语言系统(LS)、问题处理系统(PPS)和知识系统(KS)三部分组成(如图53所示),这三种系统实际上是由上面提到的基本部件发展而来的。LS实际上就是一个人机接口,它特别强调语言,特别是自然语言在接口中的重要作用。由于突出了自然语言的重要性,因此在DSS中配备了相应的问题处理系统(PPS)。根据知识工程研究成果,一些人倾向于把数据库、模型库和知识库统一为知识系统(模型库与方法库一般放在一起)。在此种结构中,更多的是强调知识系统在整个DSS中的作用。但此种路线的局限在于语言系统的开发,尤其是对于用户的自然语言的理解,使其发展相对迟缓。 图52四库决策支持系统结构 图53三系统决策支持 系统结构 在某些具体的决策支持系统中,也可以没有单独的知识库及其管理系统,但模型库和方法库通常是必需的。由于应用领域和研究方法不同,导致决策支持系统的结构有多种形式。下面介绍最简单的决策支持系统结构,包括数据管理部件、模型管理部件、用户接口部件,如图54所示。 图54二库决策支持系统结构 1. 数据管理部件 数据的一部分来自组织内部的信息系统,如事务处理系统或知识工作系统等产生的财务、会计、市场、销售、生产制造或人力资源等方面的有关数据; 数据的另一部分来自组织的外部,如行业的某些特定数据、地区经济收入水平和就业状况等,可以从政府部门或行业数据库中摘取,或者从互联网上下载; 还有来自DSS决策者个人的数据。将决策者的经验和洞察力等个人信息输入DSS中,供DSS运行时调用,这也体现了DSS的个性色彩。 2. 模型管理部件 模型管理部件中涉及的决策支持系统中的模型如表53所示。 表53决策支持系统中的模型 模型说明 统计分析模型包括计算均值、标准方差、输出散点图等,并可建立因果关系,例如把产品销售同消费者的年龄、收入或其他因素联系起来。软件包如SPSS、SAS等能完成统计分析模型的功能 预测模型用事物过去已知信息对事物的未来状态进行科学的预计和推测。定量预测模型有指数平滑模型、季节预测模型、回归预测模型,马尔可夫链预测模型等 财务模型有现金流量、内部回报率、投资分析等模型,如Excel等电子表格程序具有这些简单模型的求解功能 Whatif模型Whatif分析是对决策变量做假设性的改变以观察对目标变量影响的过程。例如敏感性分析模型提高售价5%或追加10万元的广告预算将会发生什么?如果保持售价和广告预算不变将会发生什么 优化模型线性规划、非线性规划、动态规划、目标规划和最优控制等模型。软件包LINDO专用于线性规划问题的求解 3. 用户接口部件 用户接口部件具有帮助用户使用DSS的能力,接受用户请求,并将请求输入DSS; 具有识别和处理不同类型会话方式的能力,如程序命令语言或自然命令语言; 提供多个DSS用户之间的通信支持; 具有对各种处理结果进行解释、描述和输出的能力; 具有与数据管理部件和模型管理部件友好交互的能力。 5.2.3决策支持系统的主要类型 自20世纪70年代提出决策支持系统(DSS)以来,DSS已经得到了很大发展。从目前发展情况看,主要有如下几种决策支持系统: (1) 数据驱动的决策支持系统(DataDriven DSS)。数据驱动的DSS强调以时间序列访问和操纵组织的内部数据,有时是外部数据。它通过查询和检索访问相关文件系统,提供了最基本的功能。后来发展了数据仓库系统,又提供了另外一些功能。数据仓库系统允许采用应用于特定任务或设置的特制的计算工具或者较为通用的工具和算子来对数据进行操纵。再后来发展的结合了联机分析处理(OLAP)的数据驱动型DSS则提供了更高级的功能和决策支持,并且此类决策支持是基于大规模历史数据分析的。主管信息系统(EIS)以及地理信息系统(GIS)属于专用的数据驱动型DSS。 (2) 模型驱动的决策支持系统(ModelDriven DSS)。模型驱动的DSS强调对于模型的访问和操纵,例如统计模型、金融模型、优化模型和仿真模型。简单的统计和分析工具提供最基本的功能。一些允许复杂的数据分析的联机分析处理系统(OLAP)可以分类为混合DSS系统,并且提供模型和数据的检索,以及数据摘要功能。一般来说,模型驱动的DSS综合运用金融模型、仿真模型、优化模型或者多规格模型来提供决策支持。模型驱动的DSS利用决策者提供的数据和参数来辅助决策者对于某种状况进行分析。模型驱动的DSS通常不是数据密集型的,也就是说,模型驱动的DSS通常不需要很大规模的数据库。模型驱动的DSS的早期版本被称作面向计算的DSS,这类系统有时也称为面向模型或基于模型的决策支持系统。 (3) 知识驱动的决策支持系统(KnowledgeDriven DSS)。知识驱动的DSS可以就采取何种行动向管理者提出建议或推荐。这类DSS是具有解决问题的专门知识的人机系统。“专门知识”包括理解特定领域问题的“知识”,以及解决这些问题的“技能”。与之相关的一个概念是数据挖掘工具——一种在数据库中搜寻隐藏模式的用于分析的应用程序。数据挖掘通过对大量数据进行筛选,以产生数据内容之间的关联。构建知识驱动的DSS的工具有时也称为智能决策支持方法。 (4) 基于Web的决策支持系统(WebBased DSS)。基于Web的DSS通过“瘦客户端”Web浏览器(如Netscape Navigator或Internet Explorer)向管理者或商情分析者提供决策支持信息或者决策支持工具。运行DSS应用程序的服务器通过TCP/IP协议与用户计算机建立网络连接。基于Web的DSS可以是通信驱动、数据驱动、文件驱动、知识驱动、模型驱动或者混合类型。Web技术可用于实现任何种类和类型的DSS。“基于Web”意味着全部的应用均采用Web技术实现。“Web启动”意味着应用程序的关键部分,例如数据库,保存在遗留系统中,而应用程序可以通过基于Web的组件进行访问并通过浏览器显示。 (5) 基于仿真的决策支持系统(SimulationBased DSS)。基于仿真的DSS可以提供决策支持信息和决策支持工具,以帮助管理者分析通过仿真形成的半结构化问题。这些种类的系统全部称为决策支持系统。DSS可以支持行动、金融管理以及战略决策,包括优化以及仿真等许多种类的模型均可应用于DSS。由于仿真技术已经得到了广泛应用,所以仿真决策支持系统也在各个领域展现了它的强大生命力: 华中科技大学的康玲等人将洪水灾害系统与决策支持系统结合起来,建立了数字长江防洪决策支持系统; 广州市社会科学院的吴智文等人通过计量经济模型、灾害预测和损失评估模型等进行建模与仿真,构建了“广州市森林防火指挥决策支持系统”,将仿真技术成功地应用于森林防火决策指挥。 (6) 基于GIS的决策支持系统(GISBased DSS)。基于GIS(地理信息系统)的DSS通过GIS向管理者或商情分析者提供决策支持信息或决策支持工具。通用目标GIS工具,如ARC/INFO、MAPlnfo以及ArcView等一些有特定功能的程序,可以完成许多有用的操作,但对于那些不熟悉GIS以及地图概念的用户来说,比较难掌握。特殊目标GIS工具是由GIS程序设计者编写的程序,以易用程序包的形式向用户组提供特殊功能。以前,特殊目标GIS工具主要采用宏语言编写。现在,GIS程序设计者拥有较从前丰富得多的工具集来进行应用程序开发。程序设计库拥有交互映射以及空间分析功能的类,从而使得采用工业标准程序设计语言来开发特殊目标GIS工具成为可能,这类程序设计语言可以独立于主程序进行编译和运行(单机)。同时,Internet开发工具已经走向成熟,能够开发出相当复杂的基于GIS的程序让用户通过World Wide Web进行使用。 (7) 通信驱动的决策支持系统(CommunicationDriven DSS)。通信驱动型DSS强调通信、协作以及共享决策支持。简单的公告板或者电子邮件就是最基本的功能。组件比较FAQ(常见问题解答)定义诸如“构建共享交互式环境的软、硬件”,目的是支撑和扩大群体的行为。组件是一个更广泛的概念——协作计算的子集。通信驱动型DSS能够使两个或者更多的人互相通信、共享信息以及协调他们的行为。 (8) 基于数据仓库的决策支持系统(Data WareBased DSS)。数据仓库是支持管理决策过程的、面向主题的、集成的、动态的、持久的数据集合。它可将来自各个数据库的信息进行集成,从事物的历史和发展的角度来组织和存储数据,供用户进行数据分析并辅助决策,为决策者提供有用的决策支持信息与知识。基于DW的DSS的研究重点是如何利用DW及相关技术来发现知识并向用户解释和表达,为决策支持提供更有力的数据支持,有效地解决了传统DSS数据管理的诸多问题。 (9) 群体决策支持系统(Group Decision Supporting System,GDSS)。群体决策支持系统是指在系统环境中,多个决策参与者共同进行思想和信息的交流以寻找一个令人满意和可行的方案,但在决策过程中只由某个特定的人做出最终决策,并对决策结果负责。它能够支持具有共同目标的决策群体求解半结构化的决策问题,有利于决策群体成员思维和能力的发挥,也可以阻止消极群体行为的产生,限制了小团体对群体决策活动的控制,有效地避免了个体决策的片面性和可能出现的独断专行等弊端。群体决策支持系统是一种混合型的DSS,允许多个用户使用不同的软件工具在工作组内协调工作。群体支持工具的例子有音频会议、公告板和网络会议、文件共享、电子邮件、计算机支持的面对面会议软件以及交互电视等。GDSS主要有四种类型: 决策室、局域决策网、传真会议和远程决策。 (10) 分布式决策支持系统(Distributing Decision Supporting System,DDSS)。这类DSS是随着计算机技术、网络技术以及分布式数据库技术的发展与应用而发展起来的。从架构上来说,DDSS是由地域上分布在不同地区或城市的若干个计算机系统所组成,其终端机与大型主机进行联网,利用大型计算机的语言和生成软件,而系统中的每台计算机上都有DSS,整个系统实行功能分布,决策者在个人终端机上利用人机交互,通过系统共同完成分析、判断,从而得到正确的决策。DDSS的系统目标是把每个独立的决策者或决策组织看作一个独立的、物理上分离的信息处理节点,为这些节点提供个体支持、群体支持和组织支持。它应能保证节点之间顺畅地交流,协调各个节点的操作,为节点及时传递所需的信息以及其他节点的决策结果,从而最终实现多个独立节点共同制定决策。 (11) 智能决策支持系统(Intelligence Decision Supporting System,IDSS)。IDSS是人工智能和DSS相结合,应用专家系统(Expert System,ES)技术,使DSS能够更充分地应用人类的知识或智慧型知识,如关于决策问题的描述性知识、决策过程中的过程性知识、求解问题的推理性知识等,并通过逻辑推理来帮助解决复杂的决策问题的辅助决策系统。IDSS的系统目标是: 将人工智能技术融于传统的DSS中,弥补DSS单纯依靠模型技术与数据处理技术,以及用户高度卷入可能出现意向性偏差的缺陷; 通过人机交互方式支持决策过程,深化用户对复杂系统运行机制、发展规律乃至趋势走向的认识,并为决策过程中超越其认识极限的问题的处理要求提供适用技术手段。根据IDSS智能的实现可将其分为: 基于专家系统(ES)的IDSS; 基于机器学习的IDSS; 基于智能代理技术(agent)的IDSS; 基于数据仓库、联机分析处理及数据挖掘技术的IDSS等。 (12) 自适应决策支持系统(Adaptive Decision Support System,ADSS)。ADSS是针对信息时代多变、动态的决策环境而产生的,它将传统面向静态、线性和渐变市场环境的DSS扩展为面向动态、非线性和突变的决策环境的支持系统,用户可根据动态环境的变化按自己的需求自动或半自动地调整系统的结构、功能或接口。对ADSS研究主要从自适应用户接口设计、自适应模型或领域知识库的设计、在线帮助系统与DSS的自适应设计4方面进行,其中问题领域知识库能否建立是ADSS成功与否的关键,它使整个系统具有了自学习功能,可以自动获取或提炼决策所需的知识。对此,就要求问题处理模块必须配备一种学习算法或在现有DSS模型上再增加一个自学习构件。归纳学习策略是其中最有希望的一种学习算法,可以通过它从大量实例、模拟结果或历史事例中归纳得到所需知识。此外,神经网络、基于事例的推理等多种知识获取方法的采用也使系统更具适应性。 5.3决策支持系统扎根数据分析和挖掘 决策支持系统要完成其功能和使命,离不开数据的支持。决策支持系统数据库不同于一般的数据库,有很高的性能要求,是在原基层数据库的基础上建立起来的专用数据库。现在,一般由数据仓库来充当决策支持系统数据库。数据库为决策提供数据能力或资料能力。决策支持系统紧紧扎根于数据分析和挖掘的土壤,数据仓库技术是它稳固的底座,此外也离不开联机分析处理(OLAP)技术、数据挖掘技术和其他商务智能(BI)的表示和发布技术。 5.3.1决策支持系统的支撑环境 DSS可以植根于前面讲过的事务处理环境吗?答案是否定的。事务处理环境不适宜DSS应用的原因主要有以下五点。 1. 事务处理和分析处理的性能特性不同 在事务处理环境中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短; 在分析处理环境中,用户的行为模式与此完全不同,某个DSS应用程序可能需要连续运行几个小时,从而消耗大量的系统资源。将具有如此不同处理性能的两种应用放在同一个环境中运行显然是不合适的。 2. 数据集成问题 DSS需要集成的数据。全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。当前绝大多数企业内数据的真正状况是分散而非集成的。造成这种分散的原因有多种,主要有事务处理应用分散、“蜘蛛网”问题、数据不一致、外部数据和非结构化数据来源分散。 3. 数据动态集成问题 静态集成的最大缺点在于数据集成后数据源中的变化将不能反映给决策者,导致决策者使用的是过时的数据。集成数据必须以一定的周期(例如24小时)进行刷新,人们称其为动态集成。显然,事务处理系统不具备动态集成的能力。 4. 历史数据问题 事务处理一般只需要当前数据,在数据库中一般也是存储短期数据,不同数据的保存期限也不一样,即使有一些历史数据保存下来了,也被束之高阁,未得到充分利用。但对于决策分析而言,历史数据是相当重要的,许多分析方法必须以大量的历史数据为依托。没有历史数据的详细分析,是难以把握企业的发展趋势的。DSS对数据在空间和时间的广度上都有了更高的要求,而事务处理环境难以满足这些要求。 5. 数据的综合问题 在事务处理系统中积累了大量的细节数据,一般而言,DSS并不对这些细节数据进行分析。在分析前,往往需要对细节数据进行不同程度的综合。要提高分析和决策的效率和有效性,分析型处理及其数据必须与操作型处理及其数据相分离。必须把分析型数据从事务处理环境中提取出来,按照DSS处理的需要进行重新组织,建立单独的分析处理环境,数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。 决策支持系统的支撑环境,不是事务处理系统,而是数据分析和挖掘环境,决策支持系统要扎根数据分析和挖掘,要靠数据仓库、OLAP、数据挖掘和商务智能等技术来支撑,广义上,人们把这些技术都归结为商务智能技术(Business Intelligence,BI)。 5.3.2BI底座——数据仓库技术 商务智能是一套完整的解决方案,它是将数据仓库、联机分析处理(OLAP)和数据挖掘等结合起来应用到商业活动中,从不同的数据源收集数据,经过抽取(extract)、转换(transform)和加载(load),送入数据仓库或数据集市,然后使用合适的查询与分析工具、数据挖掘工具和联机分析处理工具对信息进行处理,将信息转变为辅助决策的知识,最后将知识呈现于用户面前,以实现技术服务与决策的目的。 商务智能的支撑技术主要包括ETL(数据的提取、转换与加载)技术和数据仓库与数据集市技术、OLAP技术、数据挖掘技术及数据的发布与表示技术。数据仓库技术最为基础,可以称为BI的底座。实施BI首先要从企业内部和企业外部不同的数据源,如客户关系管理(CRM)系统、供应链管理(SCM)系统、企业资源规划(ERP)系统以及其他应用系统等搜集有用的数据,进行转换和合并,因此需要数据仓库和数据集市技术的支持。 “操作型数据库”(如银行记账系统数据库)的每一次业务操作(例如存了5元人民币),都会立刻记录到这个数据库中,长此以往,满肚子积累的都是零碎的数据,这种“干脏活累活还不得闲”的数据库就叫“操作型数据库”,面向的是业务操作。“数据仓库”用于决策支持,面向分析型数据处理,不同于操作型数据库; 另外,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。操作型数据库、数据仓库与数据库之间的关系,就像C盘、D盘与硬盘之间的关系一样,数据库是硬盘,操作型数据库是C盘,数据仓库是D盘,操作型数据库与数据仓库都存储在数据库中,只不过表结构的设计模式和用途不同。那么为什么要在操作型数据库和BI之间加这么一层“数据仓库”呢? 一是因为操作型数据库日夜奔忙,以快速响应业务为主要目标,根本没有能力满足BI的数据需求。 二是因为企业中一般存在多个应用,对应着多个操作型数据库,例如人力资源库、财务库、销售单据库、库存货品库等,BI为了提供全景的数据视图,就必须将这些分散的数据综合起来,例如为了实现一个融合销售和库存信息的OLAP分析,BI工具必须能够高效地取得两个数据库中的数据,这时最高效的方法就是将数据先整合到数据仓库中,而BI应用统一从数据仓库中取数。 数据仓库(data warehouse)是指从多个数据源收集的信息,以一种一致的存储方式保存所得到的数据集合。数据仓库创始人之一W.H.Inmon将数据仓库定义为“一个面向主题的、集成的、稳定的、包含历史数据的数据集合,用于支持管理中的决策制定过程”。在构造数据仓库时,要经过数据清洗、数据抽取转换、数据集成和数据加载等过程。面向不同的需求,对数据进行清洗以保证数据的正确性,然后对数据进行抽取,转换成数据仓库所需的形式,并实现加载到数据仓库。 数据仓库是一种语义上一致的数据存储,充当决策支持数据模型的物理实现,并存放企业战略决策所需的信息。数据仓库的数据模型有星型模式和雪花模式。星型模式最为常见,有一个包含大批数据并且不含冗余的中心表,每维一组小的附属表。雪花模式中某些维表是规范化的,因而把数据进一步分解到附加的表中,模式图形成了类似雪花的形状。对数据仓库的研究集中在数据集成中数据模式的设计、数据清洗和数据转换、导入和更新方法等。 数据仓库通常是企业级应用,因此涉及的范围和投入的成本巨大,使一些企业无力承担。因而,它们希望在最需要的关键部门建立一种适合自身应用的、自行定制的部门数据仓库子集。正是这种需求使数据集市应运而生。数据集市(data mart)是聚焦在选定的主题上的,是部门范围的。根据数据的来源不同,数据集市分为独立的和依赖的两类。在独立的数据集市中,数据来自一个或多个操作的系统或外部信息提供者,或者来自一个特定的部门或地域局部产生的数据。依赖的数据集市中的数据直接来自企业数据仓库。 数据仓库是20世纪90年代初提出的概念,到20世纪90年代中期已经形成潮流。在美国,数据仓库已成为仅次于Internet之后的又一技术热点。数据仓库是市场激烈竞争的产物,它的目标是达到有效的决策支持。大型企业几乎都建立或计划建立自己的数据仓库,数据库厂商也纷纷推出自己的数据仓库软件。目前,已建立和使用的数据仓库应用系统都取得了明显的经济效益,在市场竞争中显示了强劲的活力。 5.3.3向数据要效益——分析挖掘不止 最早人们听说过“向生产要效益”,接下来是“向管理要效益”,现在需要“向数据要效益”,从数据中获取效益。除了商务智能技术外,其他的商务智能技术还包括联机分析处理技术、数据挖掘技术,以及BI的表示和发布技术,下面依次进行简单介绍。 1. 联机分析处理技术 联机分析处理(Online Analytical Processing,OLAP)又称多维分析,由E.F.Codd在1994年提出,它对数据仓库中的数据进行多维分析和展现,是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业特性的信息进行快速、一致、交互地存取,从而获得对数据更深入了解的一类软件技术。它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。 进行OLAP分析的前提是已有建好的数据仓库,之后即可利用OLAP复杂的查询能力、数据对比、数据抽取和报表来进行探测式数据分析了。之所以称其为探测式数据分析,是因为用户在选择相关数据后,通过切片(按二维选择数据)、切块(按三维选择数据)、上钻(选择更高一级的数据详细信息以及数据视图)、下钻(展开同一级数据的详细信息)、旋转(获得不同视图的数据)等操作,可以在不同的粒度上对数据进行分析尝试,得到不同形式的知识和结果。联机分析处理研究主要集中在ROLAP(基于关系数据库的OLAP)的查询优化技术和MOLAP(基于多维数据组织的OLAP)中减少存储空间、提高系统性能的方法等。 随着数据仓库的发展,OLAP也得到了迅猛的发展。数据仓库侧重于存储和管理面向决策主题的数据; 而OLAP则侧重于数据仓库中的数据分析,并将其转换成辅助决策信息。OLAP的一个重要特点是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。 2. 数据挖掘技术 与OLAP的探测式数据分析不同,数据挖掘是按照预定的规则对数据库和数据仓库中已有的数据进行信息开采、挖掘和分析,从中识别和抽取隐含的模式和有趣知识,为决策者提供决策依据。数据挖掘的任务是从数据中发现模式。模式有很多种,按功能可分为两大类: 预测型(predictive)模式和描述型(descriptive)模式。 预测型模式是可以根据数据项的值精确确定某种结果的模式。挖掘预测型模式所使用的数据也都是可以明确知道结果的。描述型模式是对数据中存在的规则做一种描述,或者根据数据的相似性把数据分组。描述型模式不能直接用于预测。在实际应用中,根据模式的实际作用,可细分为分类模式、回归模式、时间序列模式、聚类模式、关联模式和序列模式6种。其中包含的具体算法有货篮分析(market analysis)、聚类检测(clustering detection)、神经网络(neural network)、决策树(decision tree)方法、遗传分析(genetic analysis)算法、连接分析(link analysis)、基于范例的推理(casebased reasoning)和粗集(rough set)以及各种统计模型。 OLAP与数据挖掘的区别和联系是: OLAP侧重于与用户的交互、快速响应速度及提供数据的多维视图,而数据挖掘则注重自动发现隐藏在数据中的模式和有用信息,尽管允许用户指导这一过程。OLAP的分析结果可以给数据挖掘提供分析信息作为挖掘的依据,数据挖掘可以拓展OLAP分析的深度,可以发现OLAP所不能发现的更为复杂、细致的信息。数据挖掘的研究重点则偏向数据挖掘算法以及数据挖掘技术在新的数据类型、应用环境中使用时所出现新问题的解决上,如对各种非结构化数据的挖掘、数据挖掘语言的标准化以及可视化数据挖掘等。 美国的超市有这样的系统: 当顾客采购了一车商品结账时,售货员扫描完商品后,计算机上会显示出一些信息,然后售货员会友好地问顾客: “我们有一种一次性纸杯正在促销,位于F6货架上,您要购买吗?”这句话绝不是一般的促销。因为计算机系统早就算好了,如果顾客的购物车中有餐巾纸、大瓶可乐和沙拉,则86%的可能性要买一次性纸杯。结果是,顾客说: “啊,谢谢你,我刚才一直没找到纸杯。”这不是什么神奇的科学算命,而是利用数据挖掘中的关联规则算法实现的系统。每天,新的销售数据会进入挖掘模型,与过去N天的历史数据一起,被挖掘模型处理,得到当前最有价值的关联规则。同样的算法,分析网上书店的销售业绩,计算机可以发现产品之间的关联以及关联的强弱。 3. BI的表示和发布技术 随着Web应用的普及,商务智能的解决方案能够提供基于Web的应用服务,这样就扩展了商务智能的信息发布范围。作为基于Web的商务智能解决方案,需要一些基本的组成要素,包括基于Web的商务智能服务器、会话管理服务、文件管理服务、调度与分配及通知服务、负载平衡服务和应用服务等。 商务智能所带来的决策支持功能,会给决策者或企业带来越来越明显的效率和效益。 下面介绍深圳市地方税务局决策支持系统基于BI的功能架构。 为了充分利用税收数据,提高税收数据的采集、处理和分析决策能力,实现全市税收信息的共享与集中化处理,深圳市地方税务局站在计划统计的业务角度,提出了根据现有核心业务系统中的业务数据,实现税收综合分析应用的需求,以满足税收预测与计划管理、税收预警与税源质量管理及领导决策支持等方面的需要。 深圳市地方税务局决策支持系统是在现有成熟的商务智能/数据分析产品“BI@Report数据分析展示平台”的基础上,借鉴国内相关领域的成功经验构建的,系统提供OLAP多维分析、即席查询、自定义报表分析多种分析方式,提供钻取、统计图、数理统计分析、预警、预测、KPI关键指标管理、门户集成、权限管理等典型分析应用。 决策支持系统的数据主要来源于综合征管系统、其他业务系统及外部数据等基础数据,各系统中的数据经过抽取后,建立税收分析主题模型。项目实施时实际数据量约500GB。 深圳市地方税务局决策支持系统的用户包括深圳市地方税务局、各区地方税务局、各科所等税收分析岗位人员,用户数约1000人; 峰值在线用户数不少于100人; 峰值并发用户数不少于30人(查询分析用户)+5人(定制模板和设计查询、分析用户)。 项目建设内容主要包括领导查询、税收数据综合分析、税收规划与监测、重点税源监控分析、税收综合查询分析统计、税负率分析、预警分析、纳税人综合疑点分析、征管查询分析等,报表数量约200张。深圳市地方税务局决策支持系统具备对业务数据进行查询分析、挖掘、预警、预测等方面的功能需求,系统的主要功能是满足深圳市地方税务局各部门用户进行税务数据综合分析需要,并为领导决策提供数据支持。其涉及的业务模块如图55所示。 图55深圳市地方税务局决策支持系统业务模块 5.4决策支持系统智能化——越来越强的大脑 决策支持系统如何拥有智能?答案是基于数据,甚至是大数据,数据中孕育智能。当前的决策支持系统离不开数据智能。数据智能是指大数据和人工智能技术的融合,其应用的目标是利用一系列智能算法和信息处理技术实现海量数据条件下的深度洞察和决策智能化,人们把这样的系统叫作智能决策支持系统。目前,按照智能决策方法,也可以把智能决策支持系统分为三类: 基于人工智能、基于数据仓库和基于范例推理的IDSS,如图56所示。 图56智能决策支持系统的新分类思路 基于人工智能的IDSS又可以细分为基于专家系统、基于机器学习和基于Agent的IDSS。基于专家系统的IDSS就是5.2.3节讲的智能决策支持系统,较成熟,但也存在问题,如知识获取的“瓶颈”、知识的脆弱性、缺乏人类特有的直觉判断等。基于机器学习的IDSS,需要研究有效的学习算法。基于Agent的IDSS目前尚不成熟,多Agent之间的协调是需要努力解决的问题。基于数据仓库的IDSS就是5.2.1节讲的新决策支持系统,不仅依靠模型支持,而且基于联机分析处理技术和数据挖掘技术能够充分利用隐含于数据中的信息。鉴于基于范例推理的IDSS的重要作用,也独立为一个类别,且它已有了一段时间的发展,要注意范例源的匹配与调整问题。下面一一展开说明。 5.4.1基于专家系统的IDSS 基于专家系统的IDSS是DSS中非常重要的一种类型,本节将详细地介绍相关的知识。 1. 基于专家系统的IDSS简介 专家系统与决策支持系统结合形成智能决策支持系统,如图57所示。智能决策支持系统是决策支持系统(DSS)与人工智能(AI)相结合的产物,其设计思想着重研究把AI的知识推理技术和DSS的基本功能模块有机地结合起来。有的DSS已融进了启发式搜索技术,这就是人工智能方法在DSS中的初步实现。将人工智能技术引入决策支持系统主要有两方面原因: 第一,人工智能因可以处理定性的、近似的或不精确的知识而引入DSS中; 第二,DSS的一个共同特征是交互性强,这就要求使用更方便,并在接口水平和在进行的推理上更为“透明”。 图57基于专家系统的IDSS 人工智能在接口水平,尤其是对话功能上可以做出有益的贡献,如自然语言的研究使用使DSS能用更接近于用户的语言来实现接口功能。 2. 基于专家系统的IDSS的特点 (1) 具有友好的人机接口。例如能够理解自然语言,具有模型运行结果的解释机制,能够以简单明了的方式向决策者解释问题求解结果,并能对结果进行分析。 (2) 能对知识进行表示与处理。可以有效提供模型构造知识、模型操纵知识以及求解问题所需的领域知识。 (3) 具有智能的模型管理功能。除支持结构化模型外,还应提供模型自动选择、生成等功能; 将模型作为一种知识结构进行管理,简化各子系统间的接口。 (4) 具有学习能力,以修正和扩充已有知识,使问题求解能力不断提高。 (5) 综合运用人工智能中的各种技术,对整个IDSS实行统一协调、管理和控制。 虽然近年来IDSS在技术上的发展突飞猛进,但由于面向的决策问题本身的复杂性,对于当前多数IDSS应用系统来说,有些问题还亟待解决。 (1) 脆弱性和知识获取困难: 传统IDSS难以开发应用的主要原因。 (2) 封闭性: 系统只能利用本地资源; 且系统一旦设计完成,很难再增加资源。 (3) 模块协调统一性差: 数据库、模型库、方法库和知识库如何进行通信协调。 (4) 人机协调性差: 主要表现在人机分工不合理和人机智能难结合。 (5) 灵活性和适应性差: 推理机制和解释机制往往是静态的、被动的。 3. 基于专家系统的IDSS的结构 较完整与典型的IDSS结构是在传统三库DSS的基础上增设知识库与推理机,在人机对话子系统中加入自然语言处理系统(LPS),形成智能人机接口,并在其与四库之间插入问题处理系统(PPS)构成的四库系统结构,如图58所示。 图58传统三库DSS向四库IDSS发展 四库系统的智能人机接口接受用自然语言或接近自然语言的方式表达的决策问题及决策目标,如图59所示,这较大程度地改变了人机界面的性能。 图59智能人机接口 问题处理系统处于IDSS的中心位置,是联系人与机器及所存储的求解资源的桥梁,主要由问题分析器与问题求解器两部分组成,如图510所示。 图510问题处理系统的工作流程 (1) 自然语言处理系统: 转换产生相应的问题描述,将之交由问题分析器判断问题的结构化程度,对结构化问题选择或构造模型,采用传统的模型计算求解; 对半结构化或非结构化问题则由规则模型与推理机制来求解。 (2) 问题处理系统: 是IDSS中最活跃的部件,它既要识别与分析问题,设计求解方案,还要为问题求解调用四库中的数据、模型、方法及知识等资源,对半结构化或非结构化问题还要触发推理机做推理或新知识的推求。 知识库子系统是对有关规则、因果关系及经验等知识进行获取、解释、表示、推理以及管理与维护的系统。在DSS中引进知识库子系统提高了系统的智能化程度。知识库子系统从组成上来看可分为三部分: 知识库管理系统、知识库及推理机,如图511所示。 图511知识库子系统的结构 (1) 知识库管理系统。功能主要有两个: 一是回答对知识库知识增、删、改、查等知识维护的请求; 二是回答决策过程中问题分析与判断所需知识的请求。 (2) 知识库。知识库是知识库子系统的核心。知识库中存储的是那些既不能用数据表示,也不能用模型方法描述的专家知识和经验,即决策专家的决策知识和经验知识,同时也包括一些特定问题领域的专门知识。知识库中的知识表示是为描述世界所作的一组约定,是知识的符号化过程。对于同一知识,可有不同的知识表示形式,知识的表示形式直接影响推理方式,并在很大程度上决定着一个系统的能力和通用性,是知识库系统研究的一个重要课题。知识库包含事实库和规则库两部分。例如,事实库中存放了“任务A是紧急订货”“任务B是出口任务”那样的事实。规则库中存放着如“IF任务i是紧急订货,and任务i是出口任务,THEN任务i按最优先安排计划”“IF任务i是紧急订货,THEN任务i按优先安排计划”这样的规则。 (3) 推理机。推理是指从已知事实推出新事实(结论)的过程。推理机是一组程序,它针对用户问题去处理知识库(规则和事实)。推理原理是: 若事实M为真,且有一规则“IF M THEN N”存在,则N为真。因此,如果事实“任务A是紧急订货”为真,且有一规则“IF任务i是紧急订货,THEN任务i按优先安排计划”存在,则任务A就应优先安排计划。 案例: 交通事故管理智能决策支持系统 交通事故管理问题是一个非常复杂的非结构问题。交通事故的管理可以分为事故检测、事故确定、事故响应和事故清除4个阶段,每个阶段又有很多方案需要决策者进行决策。面对大量、复杂的相关数据,决策者采取哪套救援方案、如何指挥各个部门协同工作,高效地进行事故管理,将直接影响到事故所造成的损失大小。 IDSS在决策支持系统的基础上引入人工智能技术,能够较好地解决非结构化问题,为决策者提供定性和定量的建议,辅助其决策。引入IDSS的优势在于: 对数据的采集和分析可以利用IDSS,减少人工负担; IDSS可以对事故管理措施的效果进行模拟及评价,有利于决策者做最佳选择; 由于交通事故的实时性,IDSS可以减少专家判定的延时,从而使得对于事故的处理更加及时,减少经济损失。 下面介绍支持交通事故管理的智能决策支持系统设计方案。 1. 模型库设计 模型库设计如图512所示。 图512模型库设计 2. 数据库设计 数据库设计如图513所示。 图513数据库设计 3. 知识库设计 知识库设计如图514所示。 图514知识库设计 4. 推理机设计 推理机设计如图515所示。 图515推理机设计 5. 系统实现 系统反馈流程如图516所示,交通事故管理决策输出流程如图517所示。 图516系统反馈流程 图517交通事故管理决策输出流程 5.4.2基于数据仓库的IDSS DW+OLAP+DM的决策支持系统是以数据仓库为基础的,数据仓库用来实现对决策主题数据的存储和综合,OLAP用于多维数据分析,数据挖掘用于从数据库和数据仓库中提取知识,称为基于数据仓库的新决策支持系统,结构如图518所示。为此,将智能决策支持系统称为传统决策支持系统。 图518基于数据仓库的新决策支持系统结构 数据仓库是一种管理技术,它将分布在企业网络中不同站点的商业数据集成到一起,为决策者提供各种类型的、有效的数据分析,起到决策支持的作用。数据仓库为决策支持系统开辟了一种新途径,但单依靠数据仓库能力是有限的。数据仓库中有大量的轻度综合数据和高度综合数据,这些数据为决策者提供了综合信息。数据仓库保存有大量历史数据,这些数据通过预测模型计算可以得到预测信息。数据仓库的决策支持包括查询与报表、多维分析与原因分析、预测未来、实时决策和自动决策。联机分析处理的决策支持包括切片和切块、向下钻取和向上钻取、旋转等。数据挖掘的决策支持包括关联分析、时序模式、聚类、分类、公式发现、偏差检测、预测。数据仓库、联机分析处理、数据挖掘相结合,数据仓库(DW)中增加联机分析处理(OLAP)和数据挖掘(DM)等分析工具,以数据仓库为基础,充分利用数据资源,发挥联机分析处理的多维数据分析能力和数据挖掘获取知识的能力,以决策支持系统的方式,为决策者提供快速和有效的辅助决策的信息和知识,能较大地提高辅助决策能力。 案例: 沃尔玛基于数据仓库的决策支持系统 沃尔玛建立了基于NCR Teradata数据仓库的决策支持系统,它是世界上第二大的数据仓库系统,总容量达到170TB以上。强大的数据仓库系统将世界4000多家分店的每一笔业务数据汇总到一起,让决策者能够在很短的时间里获得准确和及时的信息,并做出正确和有效的经营决策。 利用数据仓库,沃尔玛对商品进行市场类组分析(Marketing Basket Analysis),即分析哪些商品顾客最有希望一起购买。沃尔玛利用自动数据挖掘工具对这些数据进行分析和挖掘。一个意外的发现就是: 跟尿布一起购买最多的商品竟是啤酒!沃尔玛就在它的一个个商店里将它们并排摆放在一起,结果是尿布与啤酒的销量双双增长。由于这个故事的传奇和出人意料,所以一直被业界和商界所传诵。 Teradata数据库里存有196亿条记录,每天要处理并更新2亿条记录,要对来自6000多个用户的48000条查询语句进行处理。销售数据、库存数据每天夜间从4000多个商店自动采集过来,并通过卫星线路传到总部的数据仓库里。沃尔玛数据仓库里最大的一张表格(table)容量已超过300GB、存有50亿条记录,可容纳65个星期4000多个商店的销售数据,而每个商店有五万到八万个商品品种。利用数据仓库,沃尔玛在商品分组布局、降低库存成本、了解销售全局、进行市场分析和趋势分析等方面进行决策支持分析。 (1) 商品分组布局。分析顾客的购买习惯,掌握不同商品一起购买的概率,甚至考虑购买者在商店里所穿行的路线、购买时间和地点,从而确定商品的最佳布局。 (2) 降低库存成本。沃尔玛将成千上万种商品的销售数据和库存数据集中起来,通过数据分析,以决定对各个商店各色货物进行增减,确保正确的库存。沃尔玛的经营哲学是“代销”供应商的商品,也就是说,在顾客付款之前,供应商是不会拿到它的货款的. (3) 了解销售全局。各个商店在传送数据之前,先对数据进行如下分组: 商品种类、销售数量、商店地点、价格和日期等。通过这些分类信息,沃尔玛能对每个商店的情况有细致的了解。在最后一家商店关门后一个半小时,沃尔玛已确切知道当天的运营和财政情况。 (4) 市场分析。利用数据挖掘工具和统计模型对数据仓库的数据进行仔细研究,以分析顾客的购买习惯、广告成功率和其他战略性的信息。 (5) 趋势分析。沃尔玛利用数据仓库对商品品种和库存的趋势进行分析,以选定需要补充的商品,研究顾客购买趋势,分析季节性购买模式,确定降价商品,并对其数量和运作做出反应。 沃尔顿在自传中写道: “我能顷刻之间把信息提取出来,而且是所有的数据。我能拿出我想要的任何东西,并确切地知道我们卖了多少”。 沃尔玛神奇的增长在很大部分也可以归功于成功地建立了基于NCR Teradata的数据仓库系统。数据仓库改变了沃尔玛,而沃尔玛改变了零售业。在沃尔玛的影响下,世界顶尖零售企业Sears、Kmart、JCPenney、No.1 German Retailer、日本西武、三越等先后建立基于数据仓库的决策支持系统。 5.4.3基于范例推理的IDSS 范例推理(CaseBased Reasoning,CBR)是由目标范例的提示而得到的历史记忆中的源范例,并由源范例来指导目标范例求解的一种策略,它是一种重要的机器学习方法,是区别于基于规则推理的一种推理和学习模式,是指借用旧的事例或经验来解决问题,评价解决方案,解释异常情况或理解新情况,是当前人工智能及机器学习领域中的热门课题与前沿方向。研究CBR的动因有二: 一是模仿人类推理的思维方式,二是建立高效可行的计算机系统。CBR方法在许多领域都可以使用,尤其在不好总结出专家知识的领域。 CBR作为当前一种比较热门的决策支持系统推理模式,具有求解效率高、信息表达完全、范例库进化等特点。然而,经过十多年的研究,人们也发现CBR中存在一些问题,主要体现在以下两方面: 一是薄层、表层背景知识以及不完整知识如何与由范例所表示的特殊知识相集成; 二是范例工程过程的自动化,即范例知识的自动生成,如范例结构及其内容、相似性评估知识、现有范例库的自动更新、修正知识库的获取索引模式、范例标识等。这些任务目前由人工完成,然而基于已有的数据库和机器学习技术,特别是目前多数企业实施ERP系统,它提供了翔实的、准确的数据,在CBR中引入数据挖掘是非常必要且可行的。 CBR的一般过程由检索(Retrieve)、复用(Reuse)、修正(Revise)、学习(Retain)4个主过程组成,因此CBR也称为4R。 (1) 检索,根据当前问题的特征关键字从范例库中检索相似的范例集。 (2) 复用,通过相似度计算得出最符合当前问题特征的案例,并对其进行复用。 (3) 修正,若最佳匹配历史案例的解决方案仍不能解决当前问题,则对方案进行适当修改。 (4) 学习,选择相似性小于一定值的新范例存入范例库。 从图519中可以了解CBR解决问题的整体思路。在基于案例推理中,最初是一个新的案例(目标案例)以不完整的或模糊的信息出现。然后利用目标案例的这些信息来联想过去的源案例,即对案例库进行检索,由此得到一些与目标案例相关的源案例。但由此获得的案例对新问题的解决不一定正确,在最初的检索结束后,须比较它们之间的相似性,然后进一步检索两个相似体之间的更多细节,探索它们之间更进一步的可类比性和差异。在这一阶段,事实上已经初步进行了一些类比映射的工作,只是映射是局部的、不完整的。这个过程结束后,获得了一些能初步解决问题的源案例。接下来,从源案例库中选择相似度最高的一个源案例,建立它与目标案例之间一致的、一一对应的关系。下一步,利用一一对应的关系转换源案例的完整的(或部分的)求解方案,从而获得目标案例的完整的(或部分的)求解方案。若目标案例得到部分解答,则把解答的结果加到目标案例的初始描述中从头开始整个类比过程。若所获得的目标案例的求解未能给目标案例以正确的解答,则需解释方案失败的原因,且调用修补过程来修改所获得的方案。最后,类比求解的有效性应该得到评价。整个类比过程应该递增式进行,直到获得满意解。或者目前案例库没有该类解,则应该将该问题采用适当的方式加入源案例案例库中,以备将来再用。 图519CBR解决问题的一般过程 一个企业不断壮大,相应它的信息库也会越来越庞大,典型案例也越来越多,如何组织这些材料,方便以后的检索,成为目前研究的热点之一。大家都不约而同地找到数据挖掘的方法,有三类数据挖掘技术可用来从数据库中建立范例库结构: 聚类、粗糙集和主成分分析。 CBR的强大功能来源于它能从其记忆库中迅速准确地检索出相关案例。案例库和检索过程的目的是建造一个结构或过程来得到最适当的案例。案例检索应达到两个目标: 一是检索出来的案例应尽可能少; 二是检索出来的案例应尽可能与当前案例相关或相似。 在CBR中,当范例库中没有旧的范例和新范例完全匹配时,只能找到一个和待求问题比较相似的旧范例,然后再进行修正,使其能适应新情况,从而得以求解。 随着人工智能从科学研究走向实际应用,从一般思维方法探讨转入专门知识运用的重大突破,范例推理与人工智能的结合,解决了许多CBR传统技术的缺陷,它使CBR走向智能化,并具有良好的可扩充性、自适应性、可移植性以及快速响应能力,在与决策支持系统结合时,必能充分发挥决策支持系统的作用。 案例: 基于CBR和RBR的医疗决策支持系统 我国的医疗资源相对不足,不同地区和医疗机构间医疗诊断和治疗水平的不平衡和差异,使患者无法得到高水平的标准化救治,医疗质量难以得到有效保证,特别是对于心脏病这类高危疾病的诊治水平亟待提高。基于CBR、RBR的医疗决策系统为解决我国医疗资源不足、医疗质量不高的问题提供了有效的途径。但是,CBR与RBR方法具有各自的优缺点,如表54所示,能够将二者进行有效融合并应用于心脏病诊断的医疗决策支持系统的使用十分必要。谢涛学者构建了CBRRBR融合推理的医疗诊断模型,如图520所示,对于提高心脏病的医疗决策质量具有一定的实际意义。 表54CBR和RBR的优缺点比较 CBRRBR 含义CaseBased Reasoning,通过源案例指导目标案例求解,以相似度衡量。类似机器学习、神经网络RuleBased Reasoning,通过既定规则指导目标案例求解,规则是人为制定。类似专家系统 优点自组织、自学习 知识容易获取 应用广泛,使用门槛低概况性、一致性 在细分领域有很好的性能 提供推理依据 缺点案例库难以改写 推理过程无法解释 依赖经验知识获取瓶颈 无记忆 规则的脆弱性 图520CBRRBR融合推理医疗诊断模型 上述DSS的处理过程是如下。 (1) 获取医疗病案数据,进行预处理。 (2) 利用粗糙集理论对医疗病案数据进行特征属性约简。 (3) 计算约简后的医疗病案数据的粗糙集属性重要度和信息增益值,综合加权后得到病案特征的权重。 (4) 由训练病案数据建立基于KD树的病案库,对测试病案数据进行CBR病案检索。 (5) 对于相似度较高达到或超过设定的相似度阈值的测试病案,有理由认为病案库中最相似病案与其诊断结果是相同的,可直接将该最相似病案输出供医生诊断,跳转到第(7)步; 对于相似度较低低于设定的相似度阈值的测试病案,无法找到最相似的病案,所以使用RBR模块对其进行规则推理,跳转到第(6)步。 (6) 使用BaggingC4.5决策树集成技术构建RBR推理模块,对相似度低于设定阈值的病案进行RBR推理诊断。 (7) 输出推理结果。 (8) 记录推理结果的诊断效果,并将有效的病案推理结果作为新的病案加入病案库,同时更新RBR模块的决策树规则。 属性约简: 在案例的特征属性中,存在冗余、无效的特征属性,特征属性约简方法就是要去除这些特征属性。 案例特征权重: 在案例推理过程中,需要比较案例之间的相似度。案例中的各个特征属性与案例的关联度、对案例分类的有效性等都有所不同,反映出各特征属性对案例的“优劣”程度的区别。 案例检索分为以下2种。 (1) 基于相似度的检索: CBR案例检索通常使用基于相似度的方法,从案例库中检索和匹配得到与目标案例最相似的案例。 (2) 基于KD树的检索: KD树是一种基于案例空间分解的树状数据结构,它拥有同二叉树类似的结构,因而同样具有结构简单、存储和搜索效率高的特点,是一种高效的适用于多维空间的数据索引结构,非常适合用于案例库的案例存储和案例检索。 推理方法如下。 (1) 基于产生式规则直接将专家经验与知识转化成IFTHEN规则。 (2) 基于决策树通过对样本数据进行处理,使用归纳算法生成规则,并能够以内部节点和分支这类树状结构存储和表示规则: ID3、C4.5算法等。 (3) 多分类器集成人们在大量的实验中发现,如果将多个分类器的分类结果进行结合,其性能往往比单个分类器更好。集群优化推理注重的是基学习器在组合后的准确性,而非开始时各个基学习器的准确性。 系统建模过程如图521所示。 图521系统建模过程 1. 数据预处理 医疗病案数据,按照数据的类型可以分为两类: 离散型数据和连续型数据。因后续要使用分类算法,需要将连续数据离散化。 数据的清理指运用各种手段,提高医疗病案数据的准确性,清除不一致数据,删去冗余数据,包含对空值的处理、对噪声数据的处理、对不一致数据的处理。 2. 病案特征筛选 Johnson算法通过调用一个简单的贪心算法的变种,求出一个约简结果。这种算法一个自然的倾向是争取找到一个具有最小长度的简单的基本蕴涵。 3. 病案检索 1) 确定特征权重 信息增益(IG)方法是一种重要的基于信息熵的案例特征属性评价方法。医疗病案特征属性的信息增益值表示该症状特征存在和不存在情况下所获取的关于诊断结果信息的平均值,即使用这个症状特征对病案集进行分割而导致的期望熵的降低。 本方法计算得到的病案特征属性综合权重,既考虑了粗糙集中核属性对于样本分类的重要度,又利用信息增益弥补了粗糙集中非核属性的重要度的缺陷,从而获得更好的病案特征权重。 2) 建立KD树 经过一树检索后,可以查找到医疗病案库中与待诊断病案最相似的病案。如果该病案的相似度足够高,即满足预设的相似度阈值,则可将此病案作为结果输出。 4. 集成优化推理 组合多个学习器的最简单方法是通过投票,相当于学习器的线性组合,这种方法也称为线性判断组合。以抽取的N个样本作为训练集,以C4.5决策树为基学习器,训练M个决策树。在此基础上应用Bagging算法。Bagging是一种典型的投票算法,其基本思想是对一个给定样本,由之前训练的M个模型,每一个模型给出一个预测值,得票最多的值即确定为分类结果。 以前的一些决策系统,往往被称为决策支持系统或者决策辅助系统,原因是以前的技术确实只能做到辅助决策的层面,这类技术中比较成熟和典型的技术是20世纪90年代的BI,而实际上,BI只是把数据库里的数据、表、字段等信息转化成了一些关键的业务指标。而人们通过对这些关键指标的分析去做一些决策,这个决策完全是人做出的,所以叫辅助。但是今天或未来的决策系统,是由机器而不是人来做决策,这是最大的一个转变,也是与以往的决策辅助或者决策支持系统本质的区别。当然,不可能所有的决策都是完全自动的,否则人类的自主性将无法体现。系统有辅助的部分,也有自主的部分,自主的部分多数集中在所谓的战术级和运营级别的决策上,例如给什么样的用户做什么样的推荐等。而战略级别的决策,一般来说,现在还是需要人去做处理。 总之,今天的决策支持系统越来越智能化,它成为企业越来越强的大脑,在帮助或替代企业做出越来越合适的决策。 本章小结 无论做什么事情,成功与失败取决于决策的正确与否。决策往往是复杂的,依赖于工具的支持才能更快做出更好的决策,决策支持系统就是一个这样的工具。 决策支持系统是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。决策支持系统自20世纪80年代中期引入我国后,在企业或组织中扮演重要角色,发挥重要作用。 决策支持系统,因影响决策而影响企业成败,与事务处理系统相比,它的光环更大。决策支持系统的定义、特征、应用、产生发展、结构和分类,包括服务对象和服务方式,是要了解、区分和掌握的问题。特别是决策支持系统由“二库”向“四库”的演化、决策支持系统的分类、决策支持系统与管理系统的区别联系,以及决策支持系统的发展趋势,需要引发读者更多的开放性的思考。 决策支持系统功能和使命的完成,离不开数据的支持,数据仓库技术是它稳固的底座,此外也离不开联机分析处理(OLAP)技术、数据挖掘技术、其他商务智能(BI)的表示和发布技术等,而当前更多智能技术的应用,尤其是人工智能技术,使智能决策支持系统在辅助决策甚至代替决策上扮演越来越重要的角色。 习题 1. 列举出决策决定成败的其他例子。 2. 你还了解其他的决策分类视角吗? 3. 阐述决策与管理的关系。 4. 阐述决策与信息的关系。 5. 如何理解决策的艺术性? 6. 讨论: 人非圣贤,金无足赤,人们能一味追求最优决策吗? 7. 怎样克服群体决策的缺陷,提高群体决策效率? 8. 决策支持系统是帮助人们做决策还是代替人们做决策? 9. 按程序做出的决策是否就是正确的决策? 10. 总结分析决策支持系统发展过程,可分为几个阶段? 11. 决策支持系统和管理信息系统有什么区别和联系? 12. 数据仓库技术在决策支持系统中扮演什么角色? 13. 理解和阐述决策支持系统从“二库”到“四库”结构的演化。 14. 阐述决策支持系统的支撑环境,并结合当前技术发展,分析是否有变化。 15. 传统智能决策支持系统和新决策支持系统的区别有哪些? 16. 你同意书中的智能决策支持系统的新分类思路吗? 17. 谈谈决策支持系统的发展趋势,除了书中提到的,你还有什么补充? 技术学习模块D: 数据仓库技术 请扫码阅读