第3章〓计算机新技术

随着信息技术的快速发展,人工智能、云计算、大数据、物联网、虚拟现实和增强现实、区块链、5G、生物计算等计算机新技术被不断提出,引起了人们的广泛关注,并渗透到了人们的生活和工作中。本章我们将简要介绍一些计算机新技术。


3.1人工智能

3.1.1人工智能概述

简单来说,人工智能(Artificial Intelligence,AI)就是希望让机器或程序能拥有人类的智慧,研究目的是促使智能机器会听(如语音识别、机器翻译等)、会看(如图像识别、文字识别等)、会说(如语音合成、人机对话等)、会思考(如人机对弈、定理证明等)、会学习(如机器学习、知识表示等)、会行动(如机器人、自动驾驶汽车等)。总的来说,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是计算机科学的一个分支,但它不是人的智能。人工智能是对人的意识、思维的信息过程进行模拟,试图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器人。人工智能按照实现的水平可分成弱人工智能(Artificial Narrow Intelligence,ANI)、强人工智能(Artificial General Intelligence,AGI)和超人工智能(Artificial Super Intelligence,ASI)。

弱人工智能是指没有自主意识,不能独立推理思考,但能替代人类处理某一领域工作的机器或程序,如OpenAI开发的ChatGPT,微软的人工智能助理微软小娜(Cortana),百度旗下的人工智能助手小度,DeepMind开发的围棋机器人AlphaGo等。迄今为止,人工智能系统还是实现特定功能的专用人工智能,而不是像人类智能那样能够不断适应新的复杂的环境且不断涌现出新的功能。因此,目前全球人工智能的水平大部分是处于弱人工智能阶段,并在图像识别、语音识别、自然语言处理、推荐系统等方面取得了重大突破,甚至可以接近或者超越人类的水平。

强人工智能是有自主意识,能真正推理、思考,在各方面都能和人类比肩,并且能自适应地应对外界挑战的智能机器人。创造强人工智能比创造弱人工智能要难得多,目前强人工智能鲜有进展。大部分专家预测在未来几十年内强人工智能都难以实现。

超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的机器。牛津大学哲学家、知名人工智能思想家Nick Bostrom把超人工智能定义为,在几乎所有领域都比最聪明的人类大脑还要聪明很多,包括科技创新、通识和社交技能。

3.1.2人工智能发展历程

人工智能的发展历程,如图31所示,大致可以划分为6个阶段。



图31人工智能发展历程


(1) 起步发展期: 从1956年到20世纪60年代初。1956年夏,约翰·麦卡锡、马文·明斯基等科学家在美国达特茅斯学院举行的历史上第一次人工智能研讨会上,首次提出人工智能这一概念,标志着人工智能学科的诞生。人工智能概念被提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起了人工智能发展的第一个高潮。

(2) 反思发展期: 从20世纪60年代初到20世纪70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研究目标。然而,接二连三的任务失败和预期目标的落空(如无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展进入低谷。

(3) 应用发展期: 从20世纪70年代初到20世纪80年代中期。20世纪70年代专家系统趋于成熟。专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究到实际应用、从一般推理策略探讨到运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能进入应用发展的新高潮。

(4) 低迷发展期: 从20世纪80年代中期到20世纪90年代中期。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、获取知识困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来,使人工智能的发展再次进入低谷。

(5)  稳步发展期: 从20世纪90年代中期到2010年。由于网络技术的发展,特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年,IBM研发的超级计算机“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫; 2008年,IBM提出“智慧地球”的概念。上述都是这一时期的标志性事件。这一时期,人工智能的发展开始复苏。

(6)  蓬勃发展期: 从2011年至今。随着大数据、云计算、互联网、物联网等计算机技术的发展,泛在感知数据和图形处理器等计算平台推动着以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的技术鸿沟。如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来了爆发式增长的新高潮。

3.1.3人工智能的技术分支
1. 模式识别

(1)  基本概念。

模式识别(Pattern Recognition)诞生于20世纪20年代,随着20世纪40年代计算机的出现,20世纪50年代人工智能的兴起,模式识别在20世纪60年代初迅速发展成一门学科。模式识别是指对表征事物或现象的各种形式(如数值、文字、逻辑关系等)的信息进行处理和分析,对事物或现象进行描述、识别、分类和解释的过程,是人工智能的一个重要组成部分。简单来说,模式识别就是利用计算机根据样本的特征对样本进行分类,其主要应用于图像分类、文本分类、语音识别、计算机辅助治疗等方面。

(2) 模式识别的一般流程如图32所示。



图32模式识别的一般流程

2. 机器学习

(1)  基本术语。

机器学习(Machine Learning)是人工智能的一个重要分支,专门研究计算机怎样模拟或实现人类的学习行为。它是一类算法的总称,这些算法试图从有限的观测数据集中学习或挖掘出隐含在其中的规律,并利用这些规律对未知的数据进行预测或分类。

模型(Model)一般是指通过学习数据而得到的结果。

数据集(Data Set)是指一组记录的集合,其中每条记录是对一个事件或对象的描述,称为一个实例(Instance)或样本(Sample)。

在机器学习中,一般将数据集分成独立的三部分。

① 训练集(Training Set): 用于训练模型。

② 验证集(Validation Set): 用于确定控制模型复杂度的参数。

③ 测试集(Testing Set): 用来预测样本的值,主要是检验最终选择的模型的性能好坏。

特征(Feature)就是一系列用来表征事物的信息。例如: 学生信息由学号、姓名、性
别等特征组成。

标记或标签(Label)是指实例类别的标识。例如: 一份邮件是否为垃圾邮件的标记或标签为是或否。

训练(Training)是从数据中学习得到模型的过程,也称为学习(Learning)。被训练的样本称为训
练样本(Training Sample)。

测试(Testing)是指学习得到模型后,使用模型对样本进行预测的过程。被预测的样本称为测试样本(Testing Sample)。

泛化能力(Generalization): 学习得到的模型适应新样本的能力。

(2)  机器学习的一般流程如图33所示。



图33机器学习的一般流程


(3)  机器学习的算法分类。

机器学习的算法可以从多种角度来划分,具体划分方式如图34所示。



图34机器学习算法分类


① 根据任务类型划分,机器学习可划分为回归、分类、聚类、降维等。

 回归(Regression)。

回归是机器学习的一个任务,可预测连续值。例如: 预测一个城市的房价,预测某个城市的PM2.5。常见的回归算法有线性回归(Linear Regression)、逻辑回归(Logistic Regression)、局部加权回归(Locally Weighted Regression)等。

 分类(Classification)。

分类是一个有监督的学习过程,它是通过对具有类别标记的观测数据进行学习,训练得
到相应的分类器,让分类器能够对未知样本进行分类。分类模型可预测离散值,如判断一封邮件是否为垃圾邮件,判断一个病人是否患癌症。常见的分类算法有K近邻(KNearest Neighbor,KNN)、支持向量机(Support Vector Machine,SVM)、人工神经网络(Artificial Neural Network,ANN)等。

 聚类(Clusting)。

聚类是指对大量未标记的数据集,根据数据的内在相似性将数据集划分为多个类别或
簇,使类别或簇内的数据相似度高,而类别间的数据相似度低。常见的聚类算法有KMeans聚类、DBSCAN、层次聚类、谱聚类等。

 降维(Dimensionality Reduction)。

降维是机器学习中一种很重要的技术。在机器学习中经常会碰到一些高维的数据集,而
在高维特征空间中会出现数据样本稀疏、距离计算困难等问题,这类问题是所有机器学习方法共同面临的,称之为“维度灾难”问题。另外,在高维特征空间中,特征经常存在冗余。基于这些问题,降维被提出了。降维是通过某种数学变换将原始高维特征空间转换为一个低维子空间,使该子空间中的样本密度大幅增加,距离计算也更加容易。常见的降维方法有主成分分析(Principal Component Analysis,PCA)、线性判别分析(Linear Discriminant Analysis,LDA)等。

② 根据方法的角度划分,机器学习可划分为线性模型和非线性模型。

 线性模型。

假设样本x=(x1,x2,…,xd)T,其中,x1
是第一个特征,d
为特征维数。线性模型试图学习得到一个通过特征的线性组合来进行描述和预测的函数。例如: 学习一个线性模型fx=ωTx+b,其中,ωT=(ω1,ω2,…,ωd)T是各属性特征的组合系数或权重系数,b
为偏差。ω
和b
通过学习得到之后,该线性模型就确定了。线性模型的形式很简单且易于建模,具有很好的解释性。

 非线性模型。

与线性模型不同的是,非线性模型的参数不是线性的,不能用一条直线对样本进行划分。不过,许多非线性模型也是在线性模型的基础上通过引入层级结构和高维映射而得到的。

③ 根据学习方式划分,机器学习可划分为监督学习、无监督学习、半监督学习、迁移学习、强化学习等。

 监督学习(Supervised  Learning)。

监督学习是机器学习的一种方法。在监督学习过程中,数据是有标记的,通过对具有标记的训练样本进行学习,尽可能准确地对未知样本的数据进行预测。监督学习可分为分类和回归。

 无监督学习(Unsupervised  Learning)。

在无监督学习中,训练样本的标记信息未知。无监督学习的目标是通过对无标记的训练样本进行学习,进而揭示数据的内在性质及规律,为进一步分析数据提供了基础。无监督学习中研究最多、应用最广的是聚类。

 半监督学习(SemiSupervised  Learning)。

半监督学习是监督学习与无监督学习相结合的一种学习方法。半监督学习使用的数据不仅有已标记数据,而且有未标记数据。半监督学习可分为半监督分类、半监督回归、半监督聚类、半监督降维等。

 迁移学习(Transfer Learning)。

传统分类学习为了保证学习得到的分类模型泛化能力强,都有两个基本的假设:  用于学习的训练样本与测试样本满足独立同分布; 必须有足够可用的已标记训练样本才能学习得到一个好的分类模型。然而,在许多实际应用中,难以获得大量的已标记数据,且对数据进行标记非常费时、费力。此外,随着时间的推移,原先可用的已标记样本可能变得不可用,导致与新的测试样本分布不同。当一个领域(称为目标领域)只有少量已标记样本而难以训练成一个好的分类模型时,可将其他不同但相关领域(称为源领域)的知识迁移到目标领域中,这样不仅充分利用了源领域中大量的已标记样本,而且避免了烦琐的标记工作。机器学习中的迁移学习是研究此类问题的一种学习框架。迁移学习于1995年在神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems,NIPS)上被首次提出,其目的是迁移源领域已有知识来解决目标领域中只有少量已标记样本甚至没有的学习问题。近年来,迁移学习引起了人们的广泛研究和关注,也广泛应用于人们生活中,两个不同的领域共享的知识越多,迁移学习就越容易,否则就越困难,甚至会出现“负迁移”现象。例如: 一个人要是学会了骑自行车,则很容易学会骑摩托车,但学习骑三轮车反而不适应,因为它们的重心位置不同。

 强化学习(Reinforcement  Learning)。

强化学习又称为增强学习、再励学习或评价学习,是机器学习的一种学习范式,
用于描述和解决智能体(Agent)在与环境(Environment)的交互过程中通过学习策略以达成奖励(Reward)最大化或实现特定目标的问题,强调如何基于环境而行动(Action),以取得最大化的预期利益。

强化学习的灵感来源于心理学中的行为主义理论,即有机体如何在环境给予奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为,其最早可以追溯到巴甫洛夫的条件反射实验。条件反射实验从动物行为研究和优化控制两个领域独立发展,最终马尔可夫将其抽象为马尔可夫决策过程 (Markov Decision Process,MDP)。经过几十年的发展,自2016年AlphaGo击败李世石之后,融合了深度学习的强化学习技术已成为人们讨论的焦点。

强化学习是让智能体试图采取行动来操纵环境,并且从一个状态(State)转变到另一个状态,当它完成任务时给予奖励,反之没有奖励,这也是强化学习的核心思想。强化学习主要包括四个元素: 智能体、环境、行动和奖励。强化学习的目的是最大化长期累积奖励。

3. 数据挖掘

(1)  基本概念。

数据挖掘(Data Mining)通常与计算机科学有关,通过统计、在线分析处理、机器学习、模式识别、专家系统、数据库技术等方法从大量数据中挖掘出隐含在其中事先未知但又具有潜在价值的信息的过程,是人工智能和数据库领域的一个研究热点问题,广泛应用于金融、销售、医疗、电信等行业。

数据挖掘的对象可以是任何类型(如结构化、半结构化、非结构化、异构型)的数据源,数据可以是文本数据、多媒体数据、空间数据、时序数据和Web数据等。

(2)  数据挖掘的步骤。

数据挖掘的过程主要包括定义问题、建立数据挖掘库(包括数据收集、数据描述、数据选择、数据质量评估、数据清洗、数据合并和整合、元数据构建、加载数据挖掘库、维护数据挖掘库)、分析数据、准备数据、建立模型、评价模型和实施,如图35所示。



图35数据挖掘的步骤


(3)  数据挖掘十大经典算法。

2006年12月,数据挖掘国际顶级会议IEEE International Conference on Data Mining(ICDM)评选出了数据挖掘领域的十大经典算法: C4.5、KMeans聚类、SVM、Apriori、最大期望(Expectation Maximization,EM)算法、PageRank、AdaBoost、KNN、朴素贝叶斯分类器、分类与回归树(Classification and Regression Trees,CART)。这十个算法的分类如图36所示。



图36数据挖掘十大经典算法的分类


3.1.4人工智能的应用
1. 机器人

随着人工智能的快速发展,机器人也将大放异彩。在人们的生活和工作中,机器人随处可见,如扫地机器人、商用服务机器人、陪伴机器人、消防机器人、搬运机器人等。机器人的发展离不开人工智能的核心技术,如人机对话智能交互技术、情感识别技术、虚拟现实机器人技术等。人工智能技术把机器视觉、自动规划等认知技术、各种传感器整合到机器人身上,使机器人拥有判断、决策的能力,能够协助或取代人类的工作,如服务业、生产业、建筑业或危险的工作等。

2. 自然语言处理

自然语言处理(Natural Lauguage Processing,NLP)是人工智能的一个重要分支。它可以帮助计算机理解、解释和生成人类语言。在实际应用中,NLP 被广泛用于语音识别、机器翻译、智能客服等领域,如OpenAI公司的ChatGPT。

3. 语音识别

语音识别是把语音转化为文字,并对其进行识别、认知和处理。近年来,语音识别系统发展迅速,如百度语音助手、微软小娜、搜狗语音助手、Siri等。

4. 图像识别

图像识别是指通过计算机利用算法对图像进行采集、处理、分析和理解,以识别出不同
模式的目标对象的技术,是应用深度学习算法的一种重要的实践应用,如人脸识别、车牌号识别、驾驶员行为识别等。

5. 专家系统

专家系统是一种基于计算机的交互式可靠的决策系统。它使用事实和启发式方法来解决复杂的决策问题,是一个具有大量专门知识和经验的智能计算机程序系统,可以解决特定领域中最复杂的问题,被认为是人类智慧和专业知识的最高水平,是当今人工智能、深度学习和机器学习系统的前身。一般的专家系统主要包括人机接口、推理机、知识库、数据库、知识获取、解释器这六部分。


3.2云计算

3.2.1云计算的产生

云计算可追溯到1965年,Christopher Strachey在发表的一篇论文中正式提出的虚拟化的概念,而虚拟化正是云计算基础架构的核心,是云计算发展的基础。在20世纪80年代,Sun Microsystems公司提出“网络是计算机”(The Network is the Computer)的理念。2006年3月,亚马逊(Amazon)公司推出亚马逊弹性计算云(Amazon Elastic Compute Cloud,EC2)服务。EC2是一种弹性云计算服务,可以让用户在亚马逊网络服务(Amazon Web Service,AWS)的基础设施上租用虚拟机实例,用来运行应用程序或托管网站。2006 年 8 月 9 日,Google前首席执行官埃里克·施密特(Eric Schmidt)在搜索引擎大会(SES San Jose 2006)上首次提出云计算的概念。

3.2.2云计算的定义

云计算是一种基于互联网的计算模式,是对并行计算、网络计算、分布式计算技术的发展与运用。通过在网络上共享计算资源,提供可按需获取、按使用量计费的计算服务。云计算通过将计算能力、存储和网络等资源提供给用户,使其能够更加高效地进行应用程序开发、部署和运行,从而降低成本,提高灵活性和可扩展性。

根据美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)的定义,云计算具备以下5个基本特征。

(1) 随时随地按需自助服务: 用户可以根据需要自行选择和使用计算资源,无须人工干预。

(2) 广泛的网络访问: 用户可以通过标准的互联网协议,从任何地方访问计算资源。

(3) 多租户的资源池: 计算资源可以同时被多个用户共享,从而提高资源的利用率。

(4) 快速弹性的伸缩性: 用户可以根据需要快速地增加或减少计算资源,以适应不同的工作负载。

(5) 可计量的服务: 计算资源的使用量可以被测量、监控、控制和报告,从而能够对计算资源进行精细化的管理和控制。

狭义的云计算指的是厂商通过分布式计算和虚拟化技术搭建数据中心或巨型计算机,以免费或按需租用方式向技术开发者或企业客户提供数据存储、分析及科学计算等服务。广义的云计算指的是厂商通过建立网络服务器集群,向不同类型的客户提供在线软件服务、硬件租借、数据存储、计算分析等不同类型的服务。

3.2.3云计算的分类

云计算按服务的提供方式和使用范围可以分为私有云、公有云、混合云三类; 按服务类型可以分为基础设施即服务、平台即服务、软件即服务三类。云计算的分类如图37所示。



图37云计算的分类


1. 按服务的提供方式和使用范围分类

(1) 私有云。

私有云(Private Cloud)由单个组织或企业内部自行搭建和管理的云计算环境。私有云的资源是专有的,只能由内部人员或授权用户访问和使用。私有云通常由企业自己的IT部门搭建和维护,可以提供更高的安全性和可控性。

(2) 公有云。

公有云(Public Cloud)通常指由云服务提供商提供的,面向公众的云计算服务。公有云的资源是共享的,用户可以按需使用,并通过互联网访问。公有云通常由云服务提供商(如阿里云、腾讯云、华为云、AWS、Microsoft Azure、Google Cloud等)托管,用户可以根据自己的需求选择适当的服务类型和规模。

(3) 混合云。

混合云(Hybrid Cloud)是公有云和私有云两种方式的结合。考虑到安全和控制问题,并非所有的企业信息都能放置在公有云上,因此大部分已经应用云计算的企业将会使用混合云模式。混合云利用了公有云和私有云的优势,不过由于设置比较复杂,维护和保护难度较大。

除了这三类云计算,还有一些特殊的云计算形态,如社区云、行业云、政府云等,它们都是在公有云、私有云和混合云的基础上,针对不同的用户群体和行业需求而特别设计和部署的云计算环境。

2. 按服务类型分类

(1) 基础设施即服务。

基础设施即服务(Infrastructure as a Service,IaaS)是云服务提供商把由多台服务器组成的云基础设施,作为计量服务提供给用户,为用户提供计算机基础设施服务,它处于最底层。IaaS将主存储器、输入输出(Input/Output,I/O)设备、存储能力和计算能力整合成一个虚拟的资源池,为整个业界提供所需要的存储资源和虚拟化服务器等服务。这是一种托管型硬件方式,用户付费使用云服务提供商的硬件设施。IaaS的优点是用户按需租用相应计算能力和存储能力,大大降低了用户在硬件上的开销,如Amazon S3、Zimory等。

(2) 平台即服务。

平台即服务(Platform as a Service,PaaS)通常也被称为中间件,其把开发环境作为一种服务来提供。这是一种分布式平台服务,云服务提供商提供开发环境、服务器平台、硬件资源等服务给用户,用户在其平台基础上定制开发自己的应用程序并通过其服务器和互联网传递给其他用户。PaaS能够给企业或个人提供研发的中间件平台,提供应用程序开发、数据库、应用服务器、试验、托管及应用服务,如Google App Engine、Force.com等。

(3)  软件即服务。

软件即服务(Software as a Service,SaaS)是指云服务提供商将应用软件统一部署在自己的服务器上,用户根据需求通过互联网向云服务商订购应用软件服务,云服务提供商根据用户所订软件的数量、时间的长短等因素收费,并且通过浏览器向用户提供软件的模式。SaaS的优势是由云服务提供商来维护和管理软件、提供软件运行的硬件设施,用户只需拥有能够接入互联网的终端即可随时随地使用软件。这样用户不再像传统模式那样花费大量资金在硬件、软件和维护上,只需要支出一定的租赁服务费用,通过互联网就可以享受到相应的硬件、软件和维护服务,这是网络应用中最具效益的运营模式之一,如Salesforce CRM、Google Docs等。

3.2.4云计算的关键技术

云计算的关键技术包括虚拟化技术、自动化管理技术、大数据处理技术、能耗管理技术、安全与隐私保护技术、容器技术和边缘计算技术。

1. 虚拟化技术

虚拟化技术是云计算的核心技术之一。它通过将物理资源(如处理器、主存储器等)虚拟化成多个逻辑资源,从而实现资源的共享和灵活分配。虚拟化技术可以提高资源利用率,降低资源成本,并且使应用可以在不同的虚拟机实例中运行,从而实现高可用性和可伸缩性。从表现形式上看,虚拟化技术分为两种应用模式: ①将一台性能强大的服务器虚拟成多个独立的小服务器,服务不同的用户; ②将多个服务器虚拟成一个强大的服务器,完成特定的功能。这两种模式都有比较多的应用,它们的核心都是统一管理,动态分配资源,提高资源利用率。

2. 自动化管理技术

自动化管理技术也是云计算的核心技术之一。它通过自动化部署、监控、维护和优化云计算环境,提高管理效率和资源利用率。自动化管理技术包括自动化配置、自动化扩展、自动化备份等。该技术可以提高IT部门的效率,降低运维成本,同时提高应用的可靠性和可用性。

3. 大数据处理技术

大数据处理技术是云计算应用的重要技术之一。它通过分布式存储和处理大规模数据,实现数据的快速分析和挖掘。大数据处理技术包括大数据开源技术(如Hadoop、Spark等)和商业化的云计算服务(如Amazon EMR、Google BigQuery等)。该技术可以帮助企业实现数据驱动的决策和业务模式创新。

4. 能耗管理技术

云计算具有低成本、高效率等优点。它带来了巨大的规模经济效益,提高了资源利用效率,同时节省了大量能源。但随着其规模的增大,云计算本身的能耗问题越来越不可忽视。优化网络结构,升级网络设备,增加节能模式,进而在保持性能的同时降低能耗,节省大量能源,因此,能耗管理技术已经成为云计算必不可少的关键技术。

5. 安全与隐私保护技术

云计算环境中的数据和应用存在较高的风险,因此安全与隐私保护技术成为云计算发展的重要技术之一。安全与隐私保护技术包括数据加密、身份认证、访问控制等。该技术可以帮助企业保护数据安全和隐私,并确保其在云计算环境中的合规性。据调查数据显示,信息安全已经成为阻碍云计算发展的最主要原因之一,云安全成了进一步部署云计算环境的最大障碍。因此,为了使云计算能够长期稳定、快速发展,信息安全是首要解决的问题。

6. 容器技术

容器技术是云计算环境中快速部署和管理应用的重要技术之一。容器技术通过将应用和其依赖项打包到容器中,实现快速部署和迁移。容器技术可以提高应用的可移植性和可扩展性,同时降低了应用部署和管理的成本。

7. 边缘计算技术

边缘计算技术是云计算中的新兴技术,通过在距离用户最近的边缘设备上进行数据分析和处理,提高应用的响应速度和安全性。

3.2.5云计算的特点
1. 超大规模

云计算具有相当大的规模,能给予用户前所未有的计算能力。一个企业云可以有几十万甚至数百万台服务器,一个小型的私有云也可拥有数百甚至数千台服务器。例如: 全球知名云服务提供商阿里云有超过100万台服务器,拥有超过2500万个付费用户,分布在全球29个公有云地域和88个可用区,提供超过200种云产品和服务,其服务范围涵盖政府、金融、医疗、制造等行业。

2. 虚拟化

虚拟化突破了时间、空间的界限,是云计算最为显著的特点。虚拟化技术包括应用虚拟和资源虚拟两种。众所周知,云计算的物理平台与应用部署的环境在空间上是没有任何联系的,云计算是通过虚拟平台对相应终端进行操作完成数据备份、迁移和扩展等。

3. 高可靠性

云计算使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使云计算不仅具有高效的运算能力,还比使用本地计算机更可靠。

4. 按需服务

云计算是一个庞大的资源池。云计算平台能够根据用户的需求快速配备计算能力及资源,使其可以像水、电、煤气和电话那样按照使用量进行计费。

5. 高可伸缩性

用户可以利用应用软件的快速部署条件来更为简单快捷地将自身所需的已有业务及新业务进行扩展,即云计算的规模可以根据其应用的需要进行动态伸缩,可以满足用户和应用大规模增长的需要。

6. 通用性

云计算不针对特定的应用,在云计算的支撑下可以构造出千变万化的应用,同一个云计算可以同时支撑不同的应用运行。

7. 低成本

由于云计算的特殊容错措施可以采用极其廉价的节点来构成,云计算的自动化集中式管理使大量企业无须负担日益高昂的数据中心管理成本。云计算的通用性使资源的利用率比传统系统大幅提升。因此,用户可以充分享受云计算的低成本优势和超额的云计算资源与服务,经常只要花费几百美元就能完成以前需要花费数万美元才能完成的任务。

3.2.6云计算的应用

近年来,云计算被广泛应用于医疗、金融、教育、制造、零售与电子商务、媒体与娱乐等领域。

1. 医疗

在医疗领域,通过云计算、5G、大数据、物联网等计算机新技术,结合医疗技术,来建立一个完整的医疗健康服务云平台,能更好地整合医疗信息,实现医疗资源的共享和医疗范围的扩大,给人们提供更好的医疗服务。

2. 金融

在金融领域,利用云计算的模型,将信息、金融和服务等功能分散到由庞大分支机构构成的云计算平台中,为银行、保险和基金等金融机构提供云计算处理和运行服务,并共享互联网资源,从而解决现有问题,达到高效、低成本的目标。例如: 阿里巴巴、苏宁、腾讯等企业均推出了各自的金融云服务。

3. 教育

在教育领域,通过云计算将所需要的教育硬件资源虚拟化,然后将其传入互联网中,这样可以更好地整合教育资源,为教育机构、学生和老师提供一个更好、更方便、更快捷的教育云服务平台。例如: 慕课网、中国大学MOOC、学堂在线等都是教育云的应用。

4. 制造

云计算可以帮助制造企业管理生产数据和生产流程,提高生产效率和质量。例如: 制造企业可以利用云计算进行生产计划和物流管理,实现供应链的优化和协同。

5. 零售与电子商务

云计算可以为零售与电子商务企业提供数据处理和存储能力,帮助企业管理库存、订单和用户数据等。例如: 电子商务企业可以利用云计算存储和处理大量的订单数据和用户数据,并在云计算平台上部署和运行电子商务应用程序,以便为用户提供更好的服务。

6. 媒体与娱乐

云计算可以帮助媒体与娱乐企业存储和处理大量的媒体数据(如音乐、视频和游戏等)。例如: 流媒体平台可以利用云计算存储和传输大量的视频数据,并在云计算平台上部署和运行视频应用程序,以便为用户提供更好的娱乐体验。


3.3大数据

3.3.1大数据的概念

大数据(big data)的定义有很多种。

麦肯锡公司(McKinsey & Company)对大数据的定义: 大数据是指一种规模大到在采集、存储、管理、分析方面大大超出了传统数据库软件能力的数据集。

国际权威研究机构Gartner对大数据的定义: 大数据是指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

百度百科对大数据的定义: 大数据称巨量资料,是指所涉及的资料规模巨大到无法通过主流软件,在合理的时间内达到撷取、管理、处理并整理成帮助企业经营决策提供更积极目的的资讯。

维基百科对大数据的定义: 大数据又称为巨量数据、海量数据、大资料,是指所涉及的数据量规模巨大到无法通过传统数据处理应用软件,在合理时间内达到获取、管理、处理并整理成人们所能理解的信息。

3.3.2大数据的特征

大数据通常具有5个特征(5V特征): 数据量大(Volume)、数据类型多(Variety)、价值密度低(Value)、处理速度快(Velocity)和数据准确可靠(Veracity)。

1. 数据量大

大数据的首要特征就是数据量大。在二十几年前的MP3时代,存储单位为MB的MP3就可以满足人们的需求。然而,随着信息技术的快速发展,存储单位从过去的MB到GB再到TB乃至PB、EB、ZB。2012年全球数据量大概有2.7ZB,根据著名咨询机构互联网数据中心(Internet Data Center,IDC)的预计,人类社会产生的数据还在以每两年翻一番的速度增长。

2. 数据类型多

随着信息技术的快速发展,数据来源变得更加广泛,使数据形式也呈现了多样性。根据数据是否具有一定的模式、结构和关系,数据的类型主要分为结构化数据、半结构化数据和非结构化数据。数据具体表现为网站用户日志、图片、音频、视频等。多类型的数据对数据的处理能力提出了更高的要求。

3. 价值密度低

大数据的核心特征是价值。随着互联网技术、传感技术及新兴社交媒体技术的迅猛发展,数据量呈井喷式增长,但是海量数据中有价值的数据占的比例很小,即价值密度较低。如何从大量不相关的各种类型的数据中挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习、人工智能、数据挖掘等方法深度分析,发现新规律和新知识,进而应用于医疗、金融、服务业、农业等领域,是大数据时代亟待解决的难题。

4. 处理速度快

与传统的数据挖掘相比,大数据最显著的特征是处理速度快、时效性要求高。面对快速增长的数据,大数据要求有较快的处理速度及较高的时效性。在数据处理速度方面,大数据有一个著名 的“1秒定律”,即要求在秒级时间内给出分析处理结果,否则数据就失去价值了。

5. 数据准确可靠

数据的重要性在于对决策的支持,数据的规模并不能决定其是否能为决策提供帮助,但数据的准确可靠性能为制定成功的决策提供最坚实的基础。因此,追求准确可靠的数据是大数据的一项重要要求和挑战。

3.3.3大数据的关键技术

大数据的关键技术包含大数据采集技术、大数据预处理技术、大数据存储与管理技术、大数据分析与挖掘技术等。

1. 大数据采集技术

大数据采集技术主要是通过射频识别(Radio Frequency Identification,RFID)技术、传感技术、移动互联网技术及新兴社交网络技术等获得各种类型的海量数据。

2. 大数据预处理技术

大数据预处理是指对数据进行分析之前,先对采集到的原始数据进行辨析、抽取、清洗、填补、平滑、合并、规格化、一致性检查等一系列操作,其目的是提高数据的质量,为后期数据分析工作奠定基础。大数据预处理技术主要包括四部分: 数据清理、数据集成、数据转换、数据规约。

3. 大数据存储与管理技术

大数据存储与管理的主要目的是用存储器,以数据库的形式将采集与预处理后的数据存储起来,并进行管理和调用,重点解决结构化、半结构化与非结构化数据的管理与处理技术。

4. 大数据分析与挖掘技术

大数据分析是指改进已有的数据挖掘和机器学习技术,开发出新型数据挖掘技术来对海量数据进行分析。数据挖掘就是从海量、不完整、有噪声、模糊、随机的现实数据中提取隐含在其中事先未知但又具有潜在价值的信息的过程。大数据分析与挖掘主要是从可视化分析、数据挖掘算法、预测性分析、语义引擎、数据质量管理等方面,对杂乱无章的数据进行抽取、提炼和分析的过程。

3.3.4大数据的应用

随着互联网和物联网的发展,大量数据被不断地产生和积累,大数据的应用领域也越来越广泛。大数据已广泛应用于金融、医疗、零售与电子商务、交通运输、教育等领域。

1. 金融

在金融领域,大数据可以帮助银行和金融机构进行风险管理、客户分析、信用评估等,同时也可以帮助金融机构优化运营和提高服务质量。

2. 医疗

大数据在医疗领域的应用越来越广泛。医疗机构可以利用大数据进行疾病预测、诊断和治疗方案的优化等,同时还可以帮助医疗机构进行资源调配和管理。

3. 零售与电子商务

在零售与电子商务领域,大数据可以帮助企业分析客户行为、进行精准营销和推荐、优化供应链和库存管理等,从而提高企业的运营效率和盈利能力。

4. 交通运输

在交通运输领域,大数据可以帮助交通运输部门进行交通信号控制、交通事故预测、交通模拟和优化、交通数据分析、智能导航、车辆追踪、交通违章处罚等,使交通运输部门更好地管理道路交通,更好地保障运输通畅。

5. 教育

在教育领域,大数据可以帮助教育机构进行学生评估、课程设计和教学优化等任务,同时还可以帮助教育机构进行学生管理。例如: 根据学生的校园消费记录、教务系统的成绩、门禁系统的考勤等数据,进行精准助学补助。


3.4物联网

3.4.1物联网概述
1. 物联网的定义

物联网(Internet of Things,IoT)即万物相连的互联网,其起源于传媒领域,是一个基于互联网、传统电信网等的信息承载体,是信息产业发展的第三次革命。物联网是指通过射频识别技术、全球定位系统、红外感应器、激光扫描器等各种信息传感设备,按照约定的协议,将任何物品与互联网结合起来,形成一个巨大的网络。物联网通过人、机、物在任何时间、任何地点的互联互通,以实现智能化感知、识别、定位、跟踪和管理等功能。

2. 物联网的基本特征

物联网具有全面感知、可靠传递、智能处理和综合应用这四个基本特征。

(1)  全面感知。

全面感知是指利用信息传感器、射频识别、二维码、条形码和定位器等手段随时随地采集和获取物体的信息,实现数据采集的多样化、多点化、多维化和网络化。

(2)  可靠传递。

物联网的基础和核心是互联网,其是在互联网基础上延伸和拓展的一种网络。可靠传输是指通过各种接入网络与互联网的融合,建立物联网内物体间的广泛互联互通,形成“网中网”的形态,将物体的信息实时、可靠、准确地传输。

(3)  智能处理。

智能处理是指利用云计算、模糊识别和数据融合等各种智能计算技术,对海量数据进行分析和处理及对物体实施智能化的控制。

(4)  综合应用。

综合应用是根据各种业务、各个行业的具体特点,形成各种单独的业务应用或者整个行业系统的建设应用方案。

3. 物联网的分类

物联网的分类标准有很多种,按照服务范围可以将物联网分为私有物联网、公有物联网、社区物联网和混合物联网。

(1)  私有物联网(Private Internet of Things)。

私有物联网一般是指面向单一机构内部提供服务的物联网。

(2)  公有物联网(Public Internet of Things)。

公有物联网是指以互联网为载体向公众或大型用户群体提供服务的物联网。

(3)  社区物联网(Community Internet of Things)。

社区物联网是指向特定关联的“社区”或机构群体(如公安局、学校、交通运输局、市场监督管理局、生态环境局、城市管理局等)提供服务的物联网。

(4)  混合物联网(Hybrid  Internet of Things)。

混合物联网是指将上述两种或者两种以上的物联网组合起来,其后台有统一的运营维护实体。

3.4.2物联网的关键技术

物联网涉及的技术有很多,其中关键技术主要包括射频识别技术、传感技术、无线网络技术、人工智能技术和云计算技术。

1. 射频识别技术

射频识别技术相当于物联网的“嘴巴”,是物联网中“让物体开口说话的”的一种通信技术,通过无线网络识别特定目标并读写相关数据。射频识别技术主要的表现形式是RFID标签,它具有抗干扰性强、识别速度快、安全性高、数据容量大等优点。

2. 传感技术

传感技术相当于物联网的“耳朵”。在物联网中,传感器主要负责接收物体“说话”的内容。

3.  无线网络技术

物联网中物体与物体进行无障碍地交流,离不开高速、可进行大批量数据传输的无线网络,且无线网络的速度决定了设备连接的速度和稳定性。

4. 人工智能技术

人工智能与物联网是密不可分的。人工智能相当于物联网的“大脑”,其主要负责将物体“说话”的内容进行分析,从而使物体实现智能化。

5.  云计算技术

云计算也相当于物联网的“大脑”,物联网的发展离不开云计算的支持。云计算提供动态的、可伸缩的、虚拟化资源的计算模式,可实现对海量数据的存储和计算,具有非常强大的计算能力。

3.4.3物联网的应用

物联网的应用领域非常广泛,涉及各行各业,大致集中在智慧城市、智能交通、智能家居、智能医疗、智能农业等领域。

1. 智慧城市

智慧城市是指利用以移动技术为代表的物联网、云计算等新一代信息技术及社交网络、全媒体融合等技术感测、分析、整合城市运行核心系统的各项关键信息,从而对民生、环境保护、公共安全、城市服务、工商业活动等的各种需求做出智能响应,为人类创造更美好的城市生活。

2.  智能交通

智能交通系统是将互联网技术、数据通信传输技术、数据处理技术、控制技术、云计算技术和物联网技术等有效地集成,并应用于整个交通系统中,建立起能够在更大的时空范围内全方面发挥作用的,实时、准确、高效的综合交通体系。智能交通具体应用在自动驾驶汽车、智能公交车、共享单车、共享电动汽车、车联网、充电桩、智慧停车等方面。

3. 智能家居

智能家居是指通过物联网技术将与家居生活相关的各种设备(如安防系统、网络家电、空调控制、照明系统等)连接起来,构建高效的住宅设施与家庭日程事务管理系统,让家居生活更舒适、更方便、更安全、更智能化。

4. 智能医疗

智能医疗是指利用先进的物联网技术,通过将与患者相关的数据(如病史、药物治疗和过敏症、实验室检测结果和年龄)进行数字化集成,打造健康档案区域医疗信息平台,实现患者与医务人员、医疗机构、医疗设备之间的互动,逐步实现智能信息化,大大提高了医疗服务的质量和有效性。

5. 智能农业

智能农业是通过部署各种无线传感器,实时地采集智慧农场现场的环境温湿度、光照、土壤水分、土壤肥力、二氧化碳等信息,利用无线网络实现农业生产环境的智能感知、智能预警、智能决策、智能分析和专家在线指导,为农业生产提供精准化种植、可视化管理和智能化决策。


3.5虚拟现实和增强现实

3.5.1虚拟现实概述

虚拟现实(Virtual Reality,VR)是由美国VPL Research公司创始人杰伦·拉尼尔(Jaron Lanier)于20世纪80年代初提出的,也称之为人工现实,其采用计算机图形技术、计算机仿真技术、人工智能技术、传感技术、显示技术、网络并行处理技术等生成逼真的视觉、听觉、触觉、味觉等一体化的虚拟环境,使用户借助一些特殊的输入输出设备,能以自然的方式与虚拟世界中的物体进行交互、互相影响,从而使人和计算机很好地“融为一体”,给人一种“身临其境”的感受和体验。

VR是一种前沿科学技术,具有沉浸性、交互性、多感知性、构想性和自主性等特征,且大致可以分成四种类型: 桌面式虚拟现实、沉浸式虚拟现实、增强式虚拟现实和分布式虚拟现实。
近年来,随着计算机技术、人机交互技术、计算机图形技术、计算机仿真技术、人工智能、传感技术、显示技术等的快速发展与深度融合,VR正在逐步渗透到各个应用领域。

3.5.2虚拟现实的发展历程

虚拟现实的演变发展大体上可以分为四个阶段。

1. 虚拟现实的萌芽阶段(1963年以前)

1935年,美国科幻小说家斯坦利·温鲍姆(Stanley Weinbaum)在他的小说中首次构想了以眼镜为基础,涉及视觉、触觉、嗅觉等全方位沉浸式体验的虚拟现实概念,被认为是首次提出虚拟现实这一概念。

2. 虚拟现实的探索阶段(1963—1972年)

1968年,美国计算机图形学之父、著名计算机科学家Ivan Sutherland研制成功了带跟踪的头盔式立体显示器Sutherland,是虚拟现实发展史上一个重要的里程碑。不过由于当时硬件技术限制,导致Sutherland相当沉重,根本无法独立穿戴,必须在天花板上搭建支撑杆,否则无法正常使用。但Sutherland的诞生,标志着头戴式虚拟现实设备与头部位置追踪系统的诞生,为虚拟现实基本思想的产生和理论发展奠定了基础。Ivan Sutherland也因此被称为虚拟现实之父。

3. 虚拟现实概念和理论产生的初步阶段(1972—1990年)

这一时期主要有两个比较典型的虚拟现实系统: VIDEOPLACE和VIEW。Myron Krueger设计的VIDEOPLACE系统,可以产生一个虚拟图形环境,使体验者的图像投影能实时地响应自己的活动。Michael Greevy 领导完成的 VIEW 系统,是让体验者戴上数据手套和头部跟踪器,通过语言、手势等交互方式,形成虚拟现实的系统。

4. 虚拟现实理论的完善和应用阶段(1990年至今) 

在这一阶段,虚拟现实从研究型阶段转向应用型阶段,广泛应用于科研、航空、医疗、军事等人类生活的各个领域中。

3.5.3虚拟现实的关键技术

虚拟现实的关键技术主要包括以下几点。

1.  动态环境建模技术

动态环境建模技术包括实际环境三维数据获取技术、非接触式视觉技术等。虚拟环境的建立是VR系统的核心内容,目的是获取实际环境的三维数据,并根据应用的需要建立相应的虚拟环境模型。

2.  实时三维图形生成技术

三维图形生成技术目前比较成熟,利用计算机模型生成图形并不困难,但关键是要求实时产生。

3.  立体显示和传感技术

VR的交互能力依赖于立体显示和传感技术的发展,现有的设备不能满足其需求。立体显示和传感技术包括头盔式三维立体显示器、数据手套、力学和触觉传感技术。力学和触觉传感技术的研究需进一步深入,VR设备的跟踪精度和跟踪范围也有待提高。

4.  应用系统开发技术

VR应用的关键是寻找合适的场合和对象。选择适当的应用对象可以大幅度地提高生产效率、减轻劳动强度、提高产品质量。为此,必须研究VR的开发工具,如VR系统开发平台、分布式VR技术等。

5.  系统集成技术

VR系统中包括大量的感知信息和模型,故系统集成技术是虚拟环境中的重中之重。该技术包括信息同步、模型标定、数据转换、数据管理、语音识别与合成等技术。

3.5.4增强现实概述

增强现实(Augmented Reality,AR)是在虚拟现实的基础上发展起来的新兴技术,是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术,是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术。这种技术的目标是在屏幕上将虚拟世界融合在现实世界中并进行互动。体验着除了看清楚自己的世界,还可以亲身体验其他人的世界,这就是AR技术带来的冲击效果之一。这种技术最早于1990年提出。随着随身电子产品运算能力的提升,AR的用途会越来越广。

3.5.5增强现实的技术特征

AR技术一般具有虚实结合、实时交互和三维注册三个技术特征。

1.  虚实结合

虚实结合,即真实世界和虚拟世界的信息集成,是指将虚拟信息同真实场景进行融合。目前,AR系统实现虚实融合显示的主要设备一般分为头盔显示式、手持显示式及投影显示式等。按照实现原理大致分为光学透视、视频透视和光场投射三种。光学透视和视频透视已经分别应用在了AR头盔和手机上。光场投射则相对前沿,实现难度很高,但预期的最终效果更好。

2.  实时交互

实时交互是指为了让用户更方便地操控AR设备,除了传统的输入输出设备之外,手势、语音甚至眼球追踪都能用于AR设备的交互。目前,AR系统中的交互方式主要有外接设备、特定标志及徒手交互三大类。

3.  三维注册

三维注册是指在三维空间中增添定位虚拟物体,让AR设备了解现实场景中关键物体的位置并对位置的变化进行跟踪,确定所需要叠加的虚拟信息在投影平面中的位置,并将这些虚拟信息实时显示在屏幕中的正确位置,完成三维注册。三维注册技术是实现移动增强现实应用的基础技术,也是决定移动增强现实应用系统性能的关键。因此,三维注册技术一直是移动增强现实系统研究的重点和难点。

3.5.6虚拟现实和增强现实的应用

VR和AR技术的应用场景非常广泛,可以为各个行业和领域带来更加智能、高效、安全的工具和体验,同时也带来了创新和发展的机遇。下面列举几个VR和AR技术的主要应用领域。

1. 娱乐

VR和AR技术可以为娱乐行业带来更加真实、沉浸式的体验。例如: 虚拟现实游戏Beat Saber、Minecraft VR版让玩家在虚拟空间“身临其境”地体验游戏; 增强现实游戏Pokemon Go可以让玩家在真实世界中捕捉虚拟精灵并与其他玩家互动。

2. 教育与培训

VR和AR技术可以为教育与培训行业提供更加直观、生动的学习体验。例如: 利用VR技术,学生可以“身临其境”地参观历史遗迹,探索地球上的各个角落或者参与到一个虚拟实验室中进行科学实验。这种教育体验可以提供更加生动、真实的学习体验,帮助学生更好地理解和掌握知识。此外,利用VR技术可以在虚拟环境中进行各种员工培训(如模拟紧急情况下的应急处理、模拟危险场景下的操作流程等)。这种虚拟模拟可以提供更加安全、高效的培训体验,也可以帮助员工更好地掌握技能。利用AR技术,学生可以在现实环境中进行实践应用。例如: 通过AR技术实现交互式语言学习,或者通过AR技术实现三维解剖学学习。这种实践应用可以让学生更好地理解和掌握知识,也可以为学生提供更加生动、有趣的学习体验。

3. 建筑与房地产

VR和AR技术可以为建筑与房地产行业提供更加直观、实用的设计和展示效果。例如: 房屋装修设计师可以利用VR技术在虚拟环境中实现房屋的装修设计,包括墙面、地面、家具、灯光等方面。这种虚拟设计可以帮助设计师更好地理解客户的需求,也可以提供更加生动、直观的设计方案,让客户更容易做出决策。建筑施工人员可以利用AR技术在现实环境中实现施工导航,包括指导施工、检查质量、修复问题等方面。这种AR导航可以提高施工效率,减少施工错误,也可以提供更加直观、高效的工作方式。

4. 医疗与康复

VR和AR技术可以为医疗与康复行业提供更加精准、安全的治疗与康复训练方案。例如: 医生可以通过虚拟手术来增加手术的熟练度,更好地理解手术,提高手术精度和效率,减少风险,还可以通过AR技术进行手术步骤提示和导航。康复师可以通过VR技术为病人进行康复训练等。

5. 旅游与文化

VR和AR技术可以为旅游与文化行业提供更加丰富、多样的体验和交互方式。例如: 敦煌莫高窟文化遗产保护,通过AR技术进行数字化保存和重建,可以为后代提供更加真实和直观的文化遗产体验; 为了让游客提前了解目的地文化和历史而提供虚拟旅游体验,给游客更加丰富和安全的旅游体验。

6. 工业与制造

VR和AR技术可以为工业与制造行业提供更加高效、智能的生产和维护工具。例如: VR工艺仿真、AR维修指导、AR零件识别等,可以提高生产效率和质量,减少故障修复时间和事故发生率。

7. 零售

在零售行业中,VR和AR技术也有广泛的应用,如虚拟试衣间、虚拟购物店、AR促销、虚拟导购等。


3.6区块链

3.6.1区块链的概念

区块链(Block Chain)起源于比特币。2008年11月1日,中本聪(Satoshi Nakamoto)在发表的论文“Bitcoin:  A PeertoPeer Electronic Cash System”中首次提出了比特币的概念,目前关于区块链的定义仍没有统一。

维基百科对区块链的定义: 区块链是一个分布式的账本,区块链网络系统去中心地维护着一条不停增长的有序的数据区块,每一个数据区块内都有一个时间戳和一个指针,指向上一个区块,一旦数据上链之后便不能更改。

中国区块链技术和产业发展论坛对区块链的定义: 区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。

数据中心联盟对区块链的定义: 区块链是一种由多方共同维护,使用密码学保证传输和访问安全,能够实现数据一致存储、无法篡改、无法抵赖的技术体系。

3.6.2区块链的基本特征

区块链具有以下基本特征。

1. 去中心化

去中心化是区块链最突出、最本质的特征。在区块链中,没有中心化的硬件或机构,任何参与者都是一个节点,任意节点的权限都是相同的。

2. 开放性

区块链系统是开放的,除了对交易各方的私有信息进行加密,区块链中的数据对所有人公开。任何人都能通过公开的接口,对区块链中的数据进行查询,并能开发相关应用。因此,整个系统的信息高度透明。

3. 独立性

区块链采用基于协商一致的规范和协议,使系统中的所有节点都能在去信任的环境中自由安全地验证、交换数据,让对人的信任改成对机器的信任。任何人为的干预都无法发挥作用。

4. 防篡改性

任何人要修改区块链里面的数据,必须要同时控制区块链系统中51%以上的节点才能修改区块链中的数据,但这个难度非常大。这使区块链本身变得相对安全,避免了主观人为的数据变更。

5. 匿名性

由于区块链的技术解决了信任问题,所有节点能够在去信任的环境下自动运行,因此各区块节点的身份信息不需要公开或验证,信息可以匿名传递。

3.6.3区块链的关键技术
1. 分布式账本 

分布式账本是指交易记账由分布在不同地方的多个节点共同记录账本数据,而且参与的节点各自拥有独立的、完整的账本数据,人人可以参与,并具有相同的权力。分布式账本本质上是一个分布式数据库,在区块链中起到了数据储存的作用。

分布式账本与传统分布式存储的区别在于: ①区块链中每个节点都按照块链式的结构存储完整的数据; 而传统分布式存储一般是将数据按照一定的规则分成多份进行存储。②区块链中每个节点的存储都是独立的、地位等同的,依靠共识机制保证存储的一致性; 而传统分布式存储一般是通过中心节点往其他备份节点同步数据。

2. 共识机制

为了保证节点愿意主动去记账,区块链形成了一个重要的共识机制,这种共识机制也被称为区块链的灵魂。共识机制是指定义共识过程的算法、协议和规则,具有少数服从多数和人人平等的特点。目前,区块链提出了四种不同的共识机制,即算法机制、权益证明机制、委托权益证明机制和分布式一致性算法。

3. 密码学

在区块链中,交易信息是公开的,但信息的传播是按照公钥、私钥这种非对称数字加密技术实现的。公钥和私钥都经过哈希算法和椭圆曲线算法等多重转化而形成的,字符都比较长且复杂,因此比较安全。

4. 智能合约 

智能合约的概念由Nick Szabo于1995年首次提出。智能合约是一种旨在以信息化方式传播、验证或执行合同的计算机协议,是一套以数字形式定义的承诺,包括合约参与方可以在上面执行这些承诺的协议。合约的参与双方规定合约,将达成的协议提前安装到区块链系统中,合约开始执行后,不能修改。智能合约可以解决日常生活中常见的违约问题。

3.6.4区块链的类型

区块链大致可以分为公有区块链、私有区块链和联盟区块链三类。

1. 公有区块链

公有区块链(Public Blockchains)是最早的区块链,也是应用最广泛的区块链。公有区块链是指任何人都可以加入和参与的区块链,如比特币。但是,公有区块链需要大量计算,交易的隐私性极低甚至没有,安全性弱。

2. 私有区块链

私有区块链(Private Blockchains)是一个去中心化的点对点网络,仅仅使用区块链的总账技术进行记账。整个网络可以是个人也可以是一个公司,由其控制允许谁参与网络、执行共识协议和维护共享分类账。


3.  联盟区块链

联盟区块链又称为行业区块链(Consortium Blockchains),是指由某个群体内部指定多个预选的节点为记账人,每个块的生成由所有的预选节点共同决定,其他接入节点可以参与交易,但不过问记账过程。其他人可以通过该区块链开放的应用程序接口(Application Program Interface,API)进行限定查询多个组织,可以分担维护区块链的责任。

3.6.5区块链的应用

区块链技术可以应用于许多领域,带来更高的可追溯性、安全性和透明度。它是一种具有巨大潜力的技术,并且可以用于多个领域的创新和改进。下面列举几个不同领域应用的例子。

1. 金融

区块链技术作为一种去中心化的分布式数据库技术,可以被用于构建去中心化的数字货币,如比特币和以太坊。此外,它也可以用于金融交易、支付结算和资产管理等方面。区块链技术的去中心化特性,使金融交易更加安全,去除了中间人和机构的干涉和风险,并且大大减少了交易成本和时间。

2. 物联网

随着物联网设备数量的增加,数据的保护和安全变得越来越重要。区块链技术可以被用于物联网设备之间的安全数据传输和交换,可以保护设备和数据的安全,防止数据篡改和信息泄露。

3. 物流与供应链管理

在物流和供应链管理领域,区块链技术可以提高可追溯性和透明度。它可以帮助企业跟踪产品和物流信息,并保证供应链上每一步操作的可追溯性和透明度。这可以帮助消费者更好地了解产品来源和生产过程,促进企业间的合作和信任。

4. 版权保护

在数字时代,数字版权的保护变得越来越重要。区块链技术可以被用于记录版权信息和交易记录,并确保数字内容不会被篡改或盗用。这可以帮助创作者和知识产权所有者更好地保护自己的权益。

5. 社交媒体

随着社交媒体平台的发展,用户数据的安全和隐私变得越来越重要。区块链技术可以被用于建立去中心化的社交媒体平台。这些平台可以保护用户的隐私和数据安全,并防止社交媒体平台操纵用户数据。这可以帮助用户更好地保护自己的隐私和权益。

6. 公共服务

区块链技术可以被用于公共服务的管理和交互,如投票、选举和政府服务等。区块链技术的去中心化和透明性,使公共服务更加公正、透明和高效。


3.75G

3.7.15G概述

自20世纪80年代移动通信诞生以来,经过了几十年的爆发式增长,已经成为连接人类社会的基础信息网络。第五代移动通信技术,简称5G,是基于4G、3G和2G系统的延伸,也是最新一代蜂窝移动通信技术。5G的性能目标是提高数据速率、减少延迟、节省能源、降低成本、提高系统容量和大规模连接设备。目前,5G已成为全球各国竞相发展的热点问题之一。

3.7.25G的基本特点

5G具有高速率、泛在化、低功耗、低时延、万物互联和重构安全体系这六个基本特点。

1. 高速率

高速率是5G区别于4G最显著的特点,会对相关业务产生巨大影响,也会带来新的商业机会。5G网络速率被大大提高,使VR或超高清业务不受限制,这样才使对网络速率要求很高的业务被广泛推广和使用,从而大大提高了用户体验与感受。高速率的5G网络意味着用户可以每秒钟下载一部高清电影,也可能支持VR视频等。

2. 泛在化

随着业务的大力发展,5G网络需要满足更高的需求,即网络业务需要无所不包,广泛存在。只有这样才能支撑日趋丰富的业务和复杂的场景。

泛在化有广泛覆盖和纵深覆盖两个层面的含义。广泛覆盖是指我们人类社会生活的各个地方都需要被覆盖到。例如: 高山、峡谷以前不一定有网络覆盖,但到了5G时代,这些地方需要有网络覆盖。通过覆盖5G网络,可以大量部署传感器,进行环境、空气质量、地貌变化甚至地震的监测,这将非常有价值。纵深覆盖是指虽然已经有网络部署,但需要进入更高品质的深度覆盖。5G的到来,可使以前网络品质不好的卫生间、地下停车场等都能用品质很好的5G网络。一定程度上,泛在化比高速率还重要,泛在化才是5G体验的一个根本保证。


3. 低功耗

5G要支持大规模的物联网应用,就必须考虑功耗的要求。近年来,可穿戴产品取得了一定的发展,但也遇到了很多瓶颈,最大的瓶颈是用户体验较差。例如: 谷歌眼镜由于功耗太高,导致不能大规模使用,用户体验太差; 智能手表使用几个小时就需要充电,导致用户体验太差。未来,所有物联网产品都需要通信与能源,虽然通信可以通过多种手段实现,但是能源的供应只能靠电池。通信过程若消耗大量的能量,就很难让物联网产品被用户广泛接受。如果能把功耗降下来,大部分物联网产品一周或一个月充一次电,将能大大改善用户体验,促进物联网产品的快速普及。目前,低功耗主要采用增强机器类型通信(enhanced MachineType Communication,eMTC)和窄带物联网(Narrow Band Internet of Things,NBIoT)这两种技术来实现。

4. 低时延

5G应用的一个新场景是无人驾驶、工业自动化的高可靠连接。人与人之间进行信息交流,140毫秒的时延是可以接受的,但是如果这个时延用于无人驾驶、工业自动化就很难满足要求。5G对时延的最低要求是1毫秒,甚至更低,这个要求非常苛刻,却又是必需的。

5. 万物互联

传统通信中,终端是非常有限的。在固定电话时代,电话是按一定数量的人来定义的,如一个家庭一部电话,一个办公室一部电话。在手机时代,终端数量呈井喷式增长,手机是按个人应用来定义的。而在5G时代,终端不是按人来定义的,因为每个人可能拥有数个终端,每个家庭可能拥有上百个终端。此外,智能产品层出不穷,通过网络互相关联,形成真正的智能物联网世界。未来的人类社会,人们可能不再有上网的概念,联网将成为一种常态。

6. 重构安全体系

传统的互联网要解决的是信息速率、无障碍传输等问题。自由、开放、共享是互联网的基本精神,但是在5G基础上建立的是智能互联网,功能更为多元化,除了传统互联网的基本功能,还要建立起一种社会和生活的新机制与新体系。为此,智能互联网的基本精神也变成了安全、管理、高效和方便,而安全是5G时代智能互联网的首要要求。在5G的网络构建中,安全问题应该在底层就得到解决。在网络建设之初,就应该加入安全机制,网络并不应该是开放的,对于特殊的服务需要建立起专门的安全机制。随着5G的大规模部署,将会出现更多的安全问题,世界各国应就安全问题形成新的机制,建立起全新的安全体系。

3.7.35G的关键技术

5G的技术创新,主要来源于无线传输、无线接入和网络三方面。5G的关键技术大致分为无线传输技术、无线接入技术和网络技术三类。

1. 无线传输技术

(1) 大规模多天线技术。

2010年底,贝尔实验室的Thomas提出了5G中的大规模多天线(massive MultipleInput MultipleOutput,massive MIMO)的概念。大规模多天线技术是一种大规模的多输入多输出(MultipleInput MultipleOutput,MIMO)技术。MIMO技术是目前无线通信领域一个重要的研究项目,通过在基站和终端智能地使用多根天线,发射或接收更多的信号空间流,能显著地提高信道容量; 通过智能波束成型,将射频的能量集中在一个方向上,可提高信号的覆盖范围。大规模多天线技术就是采用大规模的天线,目前5G主要采用64×64的MIMO。大规模多天线技术可大幅提升无线容量和覆盖范围,但面临信道估计准确性(尤其是高速移动场景)、多终端同步、功耗和信号处理的计算复杂性等挑战。

(2) 毫米波。

在移动通信中,信号频率越高,能传输的信息量越大,能体验到的网速也更快。5G技术首次将24GHz以上的频段(通常称为毫米波)应用于移动宽带通信。大量可用的高频段频谱可提供极致的数据传输速率和容量,但使用毫米波传输更容易造成路径受阻与损耗。通常情况下,毫米波传输的信号甚至无法穿透墙体,且还面临着波形和能量消耗等问题。

(3) 同时同频全双工。

同时同频全双工技术被认为是5G的关键空中接口技术之一,是一种通过多重干扰消除实现信息同时同频双向传输的物理层技术。利用该技术,能够在相同频率同时收发信号,与现在广泛应用的频分双工技术和时分双工技术相比,同时同频全双工技术的频谱效率有望提升一倍。同时同频全双工技术能够突破频分双工技术和时分双工技术的频谱资源使用限制,使频谱资源的使用更加灵活。然而,同时同频全双工技术需要具备极高的干扰消除能力,这对干扰消除技术提出了极大的挑战,同时还存在相邻小区同频干扰的问题。在多天线及组网场景下,同时同频全双工技术的应用难度更大。

(4) D2D通信技术。

设备到设备(DevicetoDevice,D2D)通信技术是5G中的关键技术之一,是指数据传输不通过基站,而是通过一个移动终端设备与另一个移动终端设备直接通信,拓展了网络连接和接入方式。由于短距离直接通信,信道质量高具有减轻基站压力、提升系统网络性能、降低端到端的传输时延、提高频谱效率的潜力。目前,D2D采用广播、组播和单播技术方案,未来将发展其增强技术,包括基于D2D的中继技术、多天线技术和联合编码技术等。

(5) 信道编码技术。

5G信道需要抗干扰能力强、能量利用率高、系统延迟低和频谱利用率高的编码方式。低密度奇偶校验码和极化码是5G信道编码的关键候选码。低密度有偶校验码有很好的抗干扰能力,但编译码复杂。极化码是一种前向纠错的编码方式,通过信道极化处理使各子信道的可靠性呈现不同趋势。极化码具有较低的编译码复杂度,但不如低密度有偶校验码的频带利用率高,且仅在码长较长时能够接近香农极限。因此,信道编码方式的选用还需综合这两种编码方式在不同码长情况下各自的优势来确定。

2. 无线接入技术

多址接入是5G无线接入技术的具体形式,能够使多个用户在同一时间和频率资源上进行并行传输,是现代通信系统的关键特征之一。

5G除了支持传统的正交频分多址(Orthogonal Frequency Division Multiple Access,OFDMA)技术外,还支持稀疏码分多址接入(Sparse Code Multiple Access,SCMA)、非正交多址接入(NonOrthogonal Multiple Access,NOMA)、图样分割多址接入(Pattern Division Multiple Access,PDMA)、多用户共享接入(MultiUser Shared Access,MUSA)等多种新型多址技术。

3. 网络技术

(1) 网络功能虚拟化。

网络功能虚拟化(Network Function Virtualization,NFV)是通过IT虚拟化技术将网络功能软件化,并运行于通用硬件设备之上,以替代传统专用网络硬件设备。NFV将网络功能以虚拟机的形式运行于通用硬件设备之上,以实现配置的灵活性、可扩展性和移动性,并以此降低网络资本性支出和运营成本。NFV要虚拟化的网络设备主要有交换机、路由器等。

(2) 软件定义网络。

软件定义网络(Software Defined Network,SDN)是一种将网络基础设施层与控制层分离的网络设计方案,可实现集中管理,提高设计灵活性,还可引入开源工具,具备降低网络资本性支出和运营成本,以及激发创新的优势。

(3) 网络切片。

只有实现NFV和SDN后,才能实现网络切片。网络切片技术是基于NFV和SDN,将网络资源虚拟化,对不同用户、不同业务进行打包再分配资源,优化端到端的服务体验,具备更好的安全隔离特性。

(4) 多接入边缘计算。

多接入边缘计算(Multiaccess Edge Computing,MEC)是位于网络边缘的、基于云的IT计算和存储环境。MEC是在网络边缘提供电信级的运算和存储资源,使业务处理本地化,从而更好地提供低时延、高宽带服务。

3.7.45G的应用

目前的5G技术是一项非常重要的创新型技术,具有广泛的应用前景。下面对5G技术的主要应用领域进行介绍。

1. 车联网

5G技术应用于车联网领域,可提供更高速、更可靠的数据传输。5G技术能够使车辆实现高精度的定位、高速通信和远程控制,从而实现智能化驾驶和自动化驾驶。

2. 工业制造

5G技术应用于工业制造领域,可提供低延迟、高速和可靠的数据传输。这使机器能够实现高效的生产和管理,从而提高企业的生产效率和降低成本。

3. 医疗

5G技术应用于医疗等领域,可提供低延迟、高速和可靠的数据传输。这使医疗机构能够实现远程监控和远程治疗,从而提高医疗服务的质量和效率。

4. 媒体与娱乐

5G技术应用于媒体与娱乐领域,可以提供更高速、更稳定的数据传输。这使用户能够更好地享受高清视频和虚拟现实体验,从而提升媒体和娱乐产业的发展和创新。

5. 教育

5G技术应用于教育领域,可提供低延迟、高速和可靠的数据传输。在远程教育方面,学生和教师能够更真实、更实时地进行互动,从而提高教育的效率和质量。

6. 城市智能化

5G技术应用于城市智能化领域,可提供低延迟、高速和可靠的数据传输。这使城市能够实现智能交通、智能安防、智能能源和智能环保等,从而提高城市的可持续发展和智能化水平。


3.8生物计算

3.8.1生物计算概述

生物计算技术是一种利用生物学系统或模拟生物学系统的计算方式来解决复杂计算问题的技术。与传统计算机使用的数字和逻辑方式不同,生物计算机使用生物学系统中的分子、细胞、器官和生物过程等来进行计算。

3.8.2生物计算分类

生物计算技术主要分为两类: 一类是使用生物分子进行计算的技术,如DNA计算、蛋白质计算和RNA计算等; 另一类是利用生物过程和结构进行计算的技术,如脑计算、细胞计算和群体智能计算等。

1. DNA计算

DNA计算是最为成熟的生物计算技术之一。它利用DNA分子的序列和结构来进行计算,通过合成特定的DNA序列和结构来实现信息存储和逻辑运算。DNA计算主要应用于密码学、生物信息学和分子医学等领域。

2. 脑计算

脑计算是一种被广泛研究的生物计算技术。它是一种基于神经元和神经网络系统的计算方式。脑计算利用大脑中的神经元和突触等结构来进行计算,通过模拟神经网络的结构和功能来实现智能计算。脑计算主要应用于机器学习和模式识别等领域。

3. 细胞计算

细胞计算是一种使用细胞和生物过程进行计算的技术。它基于细胞中的代谢、信号传递和基因表达等过程来进行计算。细胞计算主要应用于生物医学和生物制造等领域,如设计新型药物和生物材料等。

4. 群体智能计算

群体智能计算是一种利用生物群体中的集体行为和适应性进化过程来进行计算的技术,如蚁群算法和人工免疫系统等。这种计算方式模仿了自然界中生物群体的集体行为和适应性进化过程,通过模拟这些生物过程来解决复杂的计算问题。

3.8.3生物计算的关键技术

生物计算技术是一种新兴的计算技术,具有广阔的应用前景和研究价值。随着技术的不断发展和生物学研究的进一步深入,生物计算技术有望为解决某些重要的计算问题提供全新的思路和方法。生物计算技术包含多种不同的技术,其关键技术包括但不限于以下几方面。

1. 分子生物学技术

分子生物学技术是生物计算技术中非常重要的基础。它主要包括DNA合成、PCR扩增、基因克隆、转染、荧光标记等。这些技术可用于构建基因逻辑电路、DNA计算器等生物计算器件,实现基于DNA分子的信息处理和计算。

2. 生物传感技术

生物传感技术主要用于检测和感知生物体内的信息,包括DNA传感器、蛋白质传感器、酶传感器等。这些传感器能够感受到生物体内的分子浓度、代谢活动等信息,将其转换为电信号或光信号,用于生物计算和诊断。

3. 生物信息学技术

生物信息学技术主要用于处理、存储和分析生物学数据,包括基因组学、转录组学、蛋白质组学等。这些技术可用于构建生物计算模型、优化计算算法等。

4. 脑神经网络技术

脑神经网络技术是生物计算技术中的一种重要技术,可用于模拟人脑的信息处理和智能计算,通过构建和模拟神经元和突触之间的连接,可以实现类似人脑的信息处理和智能计算。

5. 群体智能计算技术

群体智能计算技术(如蚁群算法、人工免疫系统等)可用于解决复杂的优化问题,如路径规划、最优化设计等。

3.8.4生物计算的应用

目前,生物计算技术已成为一门将计算机科学和生物学相结合的交叉学科,其应用领域非常广泛,这里不能一一阐述,仅列举几个主要应用领域。

1. 基因组学

在基因组学领域,生物计算技术可用于帮助科学家更好地理解基因组的组成和功能,从而发现与疾病相关的基因和突变,并提高基因测序和基因组数据分析的效率和精度。

2. 药物研发

在药物研发领域,生物计算技术可用于设计和优化药物分子结构,预测药物的生物活性和毒性,从而提高药物筛选和开发的效率及成功率。

3. 生物信息学

在生物信息学领域,生物计算技术可用于对生物大数据进行分析、处理和挖掘,从而发现生物信息的规律和特点,为微生物学研究提供更深入地理解和认识。

4. 生物制药

在生物制药领域,生物计算技术可用于设计和优化生物制剂的生产工艺和条件,预测生物制剂的品质和效力,从而提高生物制剂生产的效率和成功率。


本章小结

本章主要讲述了一些计算机新技术,分别是人工智能、云计算、大数据、物联网、虚拟现实和增强现实、区块链、5G、生物计算等计算机新技术的基本概念和相关知识。


习题

一、 单项选择题

1.  ()年,美国达特茅斯学院举行了历史上第一次人工智能研讨会,约翰·麦卡锡、马文·明斯基等科学家首次提出了人工智能这个概念。



A.   1950B.  1956C.  1960D.  1965

2. ()是人工智能的一个重要分支,专门研究计算机怎样模拟或实现人类的学习行为。

A.   机器学习B.  模式识别C.  数据挖掘D.  自然语言处理

3.  云计算是对()技术的发展与运用。

A.   分布式计算B.  并行计算C.  网格计算D.  以上都是

4.  下列选项中,不属于云计算按服务类型进行分类的是()。

A.   基础设施即服务B.  硬件即服务C.  平台即服务D.  软件即服务

5.  下列不属于云计算的特点的是()。

A.   超大规模B.  按需服务C.  共享D.  虚拟化

6.  下列不属于大数据特征的是()。

A.   数据量大B.  数据结构复杂C.  数据类型多D.  处理速度快

7.  下列不属于物联网的特征的是()。

A.   虚拟化B.  全面感知C.  可靠传递D.  智能处理

8.  AR技术特征包括()。

A.   虚实结合B.  实时交互C.  三维注册D.  以上都是

9.  ()是区块链最早的一个应用,也是最成功的一个大规模应用。

A.   以太坊B.  比特币C.  RSCoinD.  联盟区块链

10. 5G是指()。

A.   5G智能手机B.  5G智能电视

C.   第五代移动通信技术D.  5G网络

二、 填空题 

1.  人工智能主要分为弱人工智能、和超人工智能。

2.  云计算按服务的提供方式和使用范围可以分为私有云、、混合云。

3.  强化学习主要包括四个元素: 智能体、、行动和奖励。强化学习的目的是最大化长期累积奖励。

4.  即万物相连的互联网,是一个基于互联网、传统电信网等的信息承载体。

5.  虚拟现实大致可以分为桌面式虚拟现实、沉浸式虚拟现实、增强式虚拟现实和四类。

三、 判断题

1.  虚拟化技术是云计算最重要的核心技术之一。() 

2.  云计算不可以像水、电、煤气和电话那样按照使用量进行计费。()

3.  物联网是信息产业发展的第三次革命。()

4.  物联网的基础和核心是互联网,其是在互联网基础上延伸和拓展的一种网络。()

5.  从架构上来说,区块链是存在中心节点的一个架构。()

四、 简答题

1.  简述人工智能的应用领域。

2.  简述区块链的基本特征。

3.  简述5G的关键技术。