基础与概念篇 第1章 融媒体及相关技术基础 随着网络信息技术的发展和普及,人类社会已经进入融合媒体时代。近年来,我国几大主流媒体(如央视、新华社等)均积极转变发展思路,努力突破传统媒体的束缚,先后成立了网络电视传播平台,这预示着传统媒体(如广播、电视)将发生革命性转变。“传统媒体和新兴媒体不是取代关系,而是迭代关系;不是谁主谁次,而是此长彼长;不是谁强谁弱,而是优势互补。”在融合媒体时代的挑战下,我国传统广播电视传媒面临前所未有的挑战,为了能够符合时代发展的需求,改革不能只采取零碎化的改变、调整,而是要以融合媒体技术为基础,对传统广播电视进行重新定位,不断强化传统广播电视媒体的传播形式、品牌塑造、内容互动等,从而构建一个新型的广播电视融合媒体时代。 1.1 融媒体 现代传播技术的不断进步,使得媒体形式呈现出新的发展变化和趋势:传播内容、传播媒介、传播功能全面融合渗透,为此人们常使用一个概括词—“全媒体”来代称。目前,学术界对于全媒体的概念还未正式提出一个统一的标准。图1-1为全媒体中各媒体之间的关系。 图1-1 全媒体中各媒体之间的关系 “融媒体”不是一个独立的实体媒体,而是一个把广播、电视、互联网的优势互相整合、利用,在人力、内容、宣传等方面进行全面整合,实现“资源通融、内容兼融、宣传互融、利益共融”,并使其功能、手段、价值得以全面提升的一种新型媒体宣传理念和运作模式,图1-2为融媒体与传统媒体、新兴媒体的关系。 图1-2 融媒体与传统媒体、新兴媒体的关系 融媒体的概念又是在全媒体的基础上进一步发展和形成的,它们有联系也有区别,一般认为“全媒体”是基础,“融媒体”是目的,“融媒体”注重各介质之间的“融”,即打通介质、平台,再造新闻生产与消费各环节的流程,如图1-3所示。 图1-3 融媒体多渠道资源汇聚 1.1.1 相关概念 媒体(Media)一词来源于拉丁语Medius,音译为媒介,意为两者之间。媒体是指传播信息的媒介,是人们用来传递信息与获取信息的工具、渠道、载体、中介物或技术手段。也可以把媒体看作实现信息从信息源传递到受信者的技术手段。媒体有两层含义,一是承载信息的物体,二是存储、呈现、处理、传递信息的实体。 (1)传统媒体:主要指电视、广播、报纸、周刊(杂志)四类。 (2)新兴媒体:在新的技术支撑体系下出现的媒体形态,如数字杂志和报纸、数字广播和电视、手机短信、移动电视、数字电影、互联网、移动互联网等。 (3)融媒体:广播、电视、报刊等与基于互联网的新兴媒体有效结合,借助多样化的传播渠道和形式,将新闻资讯等广泛传播给受众,实现资源通融、内容兼融、宣传互融的新型媒体。融媒体不是一个独立的实体媒体,而是一个把广播、电视、互联网的优势互相整合的新媒体解决方案。目前认为,融媒体是一种信息共享,依据媒介属性进行信息传播的新型媒体。它与“全媒体”的不同之处在于,“融媒体”不仅包括“全媒体”所追求的技术层面的融合,还包括内容、组织架构、人员配置、管理运营等层面的融合。根据《电视台融合媒体平台建设技术白皮书》的定义:融合媒体是全媒体功能、传播手段乃至组织结构等核心要素的结合、汇聚和融合,是信息传输渠道多元化形势下的新型运作模式。融媒体目前并不是一个个体概念,而是一个集合概念。图1-4为基于广电业务的融媒体技术平台架构。 图1-4 基于广电业务的融媒体技术平台架构 (4)全媒体:信息采用文字、声音、影像、图像和网页等多种媒体表现形式,利用广播、电视、出版物、报纸、网站等不同媒介形态的业务融合,通过融合的广电网络、电信网络以及互联网进行传播,最终实现用户以电视、计算机、手机等多种终端多屏互动地融合接收,实现5W,即任何人(Who)在任何时间(When)、任何地点(Where)在任何终端(What),均能够准确、及时地获得任何想要(Want)的信息。这是媒体融合过程中早期形式的一个过渡概念。 1.1.2 融媒体的特征 融媒体是新旧媒体结合的产物,是充分利用媒介载体,把广播、电视、报纸等既有共同点,又存在互补性的不同媒体,在人力、内容、宣传等方面进行全面整合,实现“资源通融、内容兼融、宣传互融、利益共融”的新型媒体。在媒体融合态势下,传统媒体将与互联网、移动互联网等新兴媒体传播渠道有效结合,实现资源共享、集中处理,能衍生出多种形式的信息产品,多渠道广泛地传播给受众。 融媒体是内容和服务结合的产物,在网络技术飞速发展的今天,融媒体利用大数据技术丰富了信息传播内容,同时也可以根据用户需要提供高质量服务。所以,媒体传播覆盖面更广泛,无论是信息的产生处理,还是对传统媒体平台的利用,融媒体都是对传统媒体的升级和转型。 融媒体的主要特征有业务特征、运营特征和技术特征。 1. 业务特征 (1)实时传播、海量传播。 (2)充分开放、充分竞争。 (3)一体化发展。 (4)品质上追求专业权威。 (5)具备即时采集、即时发稿的报道机制。 (6)量身定做、精准传播。 (7)具备多媒体化的展示方式。 2. 运营特征 (1)实现从频道到平台的转变。 (2)实现从内容到产品的转变。 (3)实现从观众到用户的转变。 (4)实现从单网向多网、多终端、多业务的转变。 3. 技术特征 (1)节目数量大,并且以结构化、非结构化、半结构化文件呈现。 (2)节目制作方式更加精细,制作手段更加多样化。 (3)信息传播体现出社交化、移动化、视频化的趋势。 (4)融合媒体相关业务对资源的共享时效、检索时效、展现方式、权限控制等提出了更高的要求。 融媒体信息还具有交互性、实时性、协同性、集成性的特征。 1)交互性 由于融媒体时代下多种媒体形式共存,信息传播者和接收者均可以实现信息的传递、控制、编辑。融媒体的交互性,不仅能让使用者按照自己的意愿解决问题,还可以借助这种沟通方式提高工作效率。这一特点是传统广电媒体不具备的。 2)实时性 融媒体下的媒体信息的实时性主要是指在人的感官系统允许的条件下实现媒体信息交互,也就是像面对面一样,声频、影像均实现连续性传播。融媒体技术系统融合了通信网络的分布性、计算机技术的交互性和广播电视媒体的真实性。 3)协同性 由于各种媒体的传播、发展都具有各自的规律性,因此若要在多种媒体之间保持协调一致,则需保证各媒体能有机配合。融媒体技术融合了多种媒体传播技术,可在空间、时间等方面实现多种媒体协调,由此保证所有媒体信息传播的协同性。 4)集成性 媒体信息的集成性表现在完全覆盖图像、图形、文本、文字、语音、视频等多种媒体信息,但融媒体体现的不是“跨媒体”时代的媒体间的简单连接,而是全方位融合—网络媒体与传统媒体乃至通讯的全面互动、网络媒体之间的全面互补、网络媒体自身的全面互融。总之,融媒体的覆盖面、技术手段、媒介载体、受众传播面等都是最全的。 1.1.3 融媒体的融合模式 融媒体是一个集合的概念,根据融合模式可分为以下几种。 1. 平台化模式 以中央广播电视总台、《人民日报》社、新华社为代表的国家级媒体机构纷纷建立媒体资讯聚合分发及服务平台,尤其是2019年上线的央视频,提出打造“账号森林”的目标,除了有大量媒体机构入驻外,还邀约、集成了不少社会合作者的各类视频账号,实现了PGC(Professional Generated Content,专业生产内容)、UGC(User Generated Content,用户输出内容)和PUGC(UGC和PGC结合的内容生产模式)的合流。湖北广播电视台打造的政务新媒体云平台“长江云”也属于这种模式。 2. 全媒体布局模式 湖南卫视提出“以我为主”的融合理念,以湖南广电的母体资源为支撑,进行全媒体的布局。2020年7月,芒果超媒股份有限公司的市值已经达到千亿元以上。 3. 产业融合模式 如广东的南方财经全媒体集团,整合了南方报业传媒集团和广东广播电视台两家传媒单位旗下优质的财经媒体资源和经营性资产,也获得了当地政策资金的大力支持。它们以彭博社为对标,提出要建设成为一家财经通讯社,同时还要利用金融服务打造成一个文化金融控股集团。 4. 跨介质整合模式 以大连新闻传媒集团、天津海河传媒中心为代表。2018年8月,大连市将大连报业集团、大连广播电视台、大连京剧院、大连舞美设计中心、团市委宣传教育中心等11家单位整合到一起,组建了大连新闻传媒集团。2018年11月,由天津日报社、今晚报社、天津广播电视台整合的天津海河传媒中心正式成立。 5. 多元经营模式 以纸媒最为常见,像浙报集团、成都商报都是典型的代表。到2016年,报业多元化经营的产业已经涉及160多个领域,很多报社的非报产业经营收入比重已经达到报社经营收入的一半以上。这方面,纸媒比广电走得远、走得快。 6. 本地化服务模式 以苏州电视台为代表,将“无线苏州”“城市服务”与电视栏目进行深度结合,把电视媒体的品牌力和公信力转化为城市服务品牌,从而实现媒体的跨界融合和服务转型;同时还以“无线苏州”为模板,复制到多个城市,与全国40多个城市结成联盟,共同打造“城市服务信息云平台”。 7. TMT模式 将Technology(科技)、Media(媒体)、Telecom(通信)三大领域融合发展。 这一模式在国外有更多尝试,例如,有线电视运营商康卡斯特向媒体和互联网行业拓展,谷歌由互联网行业向媒体和通信行业拓展,AT&T由通信行业向媒体和互联网行业拓展。国内传统媒体方面,山东广播电视台和海信集团达成合作,海信集团OTT智能电视云平台“聚好看”上建立了“山东广播电视台”专区,内容与硬件绑定,双方共享内容资源、数据分析、用户画像等。 就目前的发展阶段来看,以上模式大多处于探索和尝试阶段,未来仍然存在一定的不确定性。虽然有些模式已经在商业或媒体影响力等方面取得了阶段性成果,但也不是放之四海而皆准的,孰好孰坏还有待进一步观察。 1.1.4 媒体融合的发展 1. 理念形成初步启动期(2013—2015年) 2013年8月19日,习近平同志在全国宣传思想工作会议上指出,“要加快传统媒体和新兴媒体融合发展,充分运用新技术新应用创新媒体传播方式,占领信息传播制高点。” 2014年8月18日,中央全面深化改革委员会第五次会议审议通过了中共中央《关于推动传统媒体和新兴媒体融合发展的指导意见》。 2. 认识深入整体推进期(2016—2018年) 2016年2月19日,习近平同志在党的新闻舆论工作座谈会上指出,“随着形势发展,党的新闻舆论工作必须创新理念、内容、体裁、形式、方法、手段、业态、体制、机制,增强针对性和实效性。”“要推动融合发展,主动借助新媒体传播优势。” 习近平同志在2018年8月21日召开的全国宣传思想工作会议上强调,“要扎实抓好县级融媒体中心建设,更好引导群众、服务群众。”“我们必须科学认识网络传播规律,提高用网治网水平,使互联网这个最大变量变成事业发展的最大增量。” 2018年11月14日,中央全面深化改革委员会第五次会议审议通过了《关于加强县级融媒体中心建设的意见》。 3. 媒体融合纵深发展期(2019—2023年) 2019年1月25日,习近平同志在中共中央政治局第十二次集体学习时强调:“推动媒体融合发展、建设全媒体成为我们面临的一项紧迫课题。”“推动媒体融合发展,要坚持一体化发展方向,通过流程优化、平台再造,实现各种媒介资源、生产要素有效整合,实现信息内容、技术应用、平台终端、管理手段共融互通,催化融合质变,放大一体效能,打造一批具有强大影响力、竞争力的新型主流媒体。” 2019年3月16日,习近平同志在《加快推动媒体融合发展 构建全媒体传播格局》中指出:“推动媒体融合发展、建设全媒体成为我们面临的一项紧迫课题。要运用信息革命成果,推动媒体融合发展,做大做强主流舆论,巩固全党全国人民团结奋斗的共同思想基础,为实现‘两个一百年’奋斗目标、实现中华民族伟大复兴的中国梦提供强大精神力量和舆论支持。” 2020年9月26日,中共中央办公厅、国务院办公厅印发了《关于加快推进媒体深度融合发展的意见》。 2020年11月3日,《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》发布,明确提出“推进媒体深度融合,实施全媒体传播工程,做强新型主流媒体,建强用好县级融媒体中心”。我国媒体融合发展到了新阶段,标志着全面布局互联网、中央省市县协同发展的开始。 2022年8月16日,中共中央办公厅、国务院办公厅印发的《“十四五”文化发展规划》中提出加快推进媒体深度融合发展。 2023年3月5日,第十四届全国人大《政府工作报告》首次提出“扎实推进媒体深度融合。提升国际传播效能”。 1.1.5 媒体融合的意义 媒体融合是新时代国家的重大战略需求,党的二十大报告指出:加强全媒体传播体系建设,塑造主流舆论新格局。健全网络综合治理体系,推动形成良好网络生态。 要运用信息革命成果,推动媒体融合向纵深发展,做大做强主流舆论,巩固全党全国人民团结奋斗的共同思想基础。 要深刻认识新形势下加强和改进国际传播工作的重要性和必要性,下大气力加强国际传播能力建设。 1.1.6 融媒体及其技术的发展趋势 1. 融媒体的发展趋势 1)融媒体将成为社会操作系统 随着传播环境的多元化,融媒体在人类社会、物质世界、信息世界以及虚拟世界之间的媒介耦合作用愈发明显。 随着传播形态的进化,各类网络不断发展,并向终端延伸,依托于网络的融媒体传播无处不在、无所不及。 融媒体的发展促进了社会关系重构,加速了社会组织形态的重造和产业结构的重塑,从而成为社会的操作系统,如图1-5所示。 图1-5 融媒体的社会操作系统角色 2)融媒体将成为治国理政的重要抓手 融媒体起到了宣传政策、通达民意的作用,是国家治理、社会治理的新要求、新主体、新方式和新场景。国家治理包括国家层面的全国性公共产品提供、跨区域协调职能以及省市层面的信息上行下达、重大项目实施、产业创新、协调发展和监督指导考核。基层治理主要表现为县、区级的社会治理,是治理的微观表现,其最主要的特征是直接面向广大民众。 融媒体利用现代网络手段,把社会主义核心价值观日常化、具体化、形象化和生活化,使每个人都能感知它、领悟它,把它内化为精神追求,外化为实际行动。 3)融媒体将成为数字经济的重要组成部分 数字经济是一个经济学概念,是人类通过大数据的识别、选择、过滤、存储、使用,引导、实现资源的快速优化配置与再生,实现经济高质量发展的经济形态。数字经济主要研究生产、分销和销售都依赖数字技术的商品和服务,给包括竞争战略、组织结构和文化在内的管理实践带来了巨大的冲击。 数字经济的技术层面体现在大数据、云计算、物联网、区块链、人工智能、5G通信等新兴技术上;其应用层面的典型代表主要有“新零售”“新制造”等。 如图1-6所示,数字经济产业主要包括内涵产业(ICT产业、数字传媒产业和网络平台产业)和外延产业(数字化赋能产业),要使媒体经济效益大幅提升,需要媒体生产要素产品化、生产形式工具化和生产规模工厂化。 图1-6 数字经济产业的构成 4)融媒体将在国际竞争中发挥重要作用 截至2023年10月,世界人口达到了80.6亿,社交平台用户达到了49.5亿,约占全世界总人口六成。数据规模将在2025年达到175ZB,日增10亿条社交传播数据。这个庞大的规模将导致媒体在国际竞争中发挥极其重要的作用,由此带来的后果可能是某些国家利用网络黑客,将深度伪造的虚假信息、不良信息作为进攻敌对国家的武器,从而使媒介武器化。从未来的国家竞争形态上看,进攻武器的媒介化将会起着越来越大的作用。 5)AI将深入融媒体的方方面面 AIGC(AI Generated Content,人工智能生成内容)也叫生成式AI,就是用人工智能来生成内容,它可以用输入数据生成相同或不同类型的内容。 智慧媒体内容可计算,触达规律可解释,用户需求可侦测,传播效果可导控。 2. 融媒体技术的发展趋势 融媒体技术是用于融媒体内容采集、存储、制作、播出、分发、传输、接收等环节的各种技术的统称。 融媒体技术涉及计算机应用技术、通信技术、信息与网络技术等,整合了云计算、大数据、人工智能、5G技术和互联网等新技术,促进了媒体生产的集约化、数字化和智能化。具体来说,融媒体未来发展趋势表现在如下几方面。 (1)互联网将起到越来越重要的作用。互联网的兴起,改变了人们快速获得信息的途径和方法,为人工智能、大模型、大数据、区块链等技术的广泛应用奠定了基础,必将推动广播电视融媒体内容选题、素材集成、编辑制作、媒资管理等环节的智能化发展。 (2)数字视频新媒体拥有广阔的发展前景和空间。传统媒体向融媒体拓展的一个重要方向就是包括网络视频、数字电视、手机电视、户外显示屏在内的各种视频媒体。视频新媒体的发展将催生更多的内容提供方式和信息服务形式变革,促进整个传媒业的融媒体发展进程。 (3)媒体融合由浅入深,从“物理变化”趋向“化学变化”。注重多种传播手段并列应用的全媒体新闻将发展为多种媒体有机结合的融合新闻;各种媒体机构的叠加、组合将发展为真正有利于融合媒介运作的新型机构组织;全媒体记者将与细分专业记者分工合作;媒介机构也将在新的市场格局中寻找新的自身定位和业务模式,构建适应全媒体需要的产品体系和传播平台。 (4)随着媒体进程的不断发展,在融合的同时,各种媒介形态、终端及其生产也将更加专业化并进一步细分。一方面表现在媒体形态的分化,如广播电视分化为网络电视、手机电视等更丰富的产品形态。同时,媒体终端的多样化也会带来传播网络的分化,如手机媒体、电子阅读器、网络电视、数字电视等分别依赖不同的传输网络。另一方面,媒体生产流程的细分更专业。在融媒体时代,由于生产复杂度的提高,更有可能导致产业流程的专业分工和再造,出现信息的包装及平台提供者走向专业化的趋向,如数字报纸、电子杂志、手机媒体领域等。 (5)5G为融媒体发展提供了技术基础。5G技术的三大应用场景—增强型移动宽带、低时延高可靠连接、海量低功耗连接被广泛应用于超高清视频、VR直播、超高清转播等方面,将以高速率、低时延、大连接等特点满足融媒体的各种业务场景。 (6)人工智能能实现融媒体的智能处理、识别、分析、生成、传输等功能,在融媒体内容生产、分发传输、监测监管等领域的应用也在持续深化。以人工智能推荐算法优化的字幕、主播、虚拟现实以及无障碍播报等技术将进一步推动融媒体平台的智慧化发展。 (7)融媒体技术是一种增加媒体表现形式的方法,但是并不会从根本上改变媒体的本质属性。虚拟现实、传感器、增强现实、生物媒体等技术,以及定制化生产、个人云平台、人和物的协同将成为未来媒体技术的发展方向。 1.2 因特网 当今世界,正在经历一场更大范围、更深层次的科技革命和产业变革。互联网、大数据、人工智能等现代信息技术不断取得突破,数字经济蓬勃发展,各国利益更加紧密相连(2018年11月7日,习近平致第五届世界互联网大会的贺信)。 因特网源自英文的Internet,它的含义广义上看就是“连接网络的网络”。这种将计算机网络互相连接在一起的方法称为网络互联。作为专有名词,它所指的是全球公有、使用TCP/IP通信协议的计算机系统。因此,下面先简单介绍一下计算机。 1.2.1 计算机的组成 计算机由硬件系统和软件系统两部分组成。计算机硬件系统由中央处理器(Central Processing Unit,CPU)、存储器、输入设备、输出设备组成。 1. 硬件系统 1)中央处理器 中央处理器是计算机的运算控制中心,计算机所有数据的加工处理都是在CPU中完成的,它的性能直接决定计算机的运算处理能力。 2)存储器 存储器分为内部存储器和外部存储器。内部存储器简称内存,计算机要执行的程序、要处理的信息和数据,都必须先存入内存,才能由CPU取出进行处理。 内存一般分为随机读写存储器(Random Access Memory,RAM)和只读存储器(Read Only Memory,ROM)两种。 (1)内部存储器。 ROM中存储的数据只能读出,保存的数据在断电后不会丢失,因此经常用来保存基本输入/输出系统BIOS,这是一个对输入/输出设备进行管理的程序。 RAM中存储的数据可以随时读出,也可以随时写入新数据,或对原来的数据进行修改。RAM的缺点是断电以后存储的所有数据都将丢失。高速缓冲存储器(cache)存储了频繁访问的RAM位置的内容及这些数据项的存储地址。 当RAM的访问速度低于微处理器的速度时,常使用高速缓冲存储器。 (2)外部存储器。 外部存储器的特点是存储容量大、价格较低,所存储的数据在计算机断电后也不会丢失,主要有软盘、硬盘、光盘和数据磁带等。 硬盘分区实质上是对硬盘的一种格式化,然后才能使用硬盘保存各种信息,常见的分区格式有FAT16、FAT32、NTFS。 FAT16分区格式是MS-DOS和早期的Windows 95操作系统中常见的磁盘分区格式,采用16位的文件分配表,最大能支持2GB的分区,最大可管理2GB的分区,但每个分区最多只能有65525个簇(簇是磁盘空间的配置单位)。随着硬盘或分区容量的增大,每个簇所占的空间将增大,从而导致硬盘空间的浪费。FAT32分区格式采用32位的文件分配表,使其对磁盘的管理能力有了极大的增强,可以支持大到2TB的分区。FAT32有一个优点:在一个不超过8GB的分区中,FAT32分区格式的每个簇容量都固定为4KB,与FAT16相比,可以大大减少磁盘的浪费,提高磁盘的利用率。但由于文件分配表的扩大,运行速度比采用FAT16格式分区的磁盘要慢。 NTFS是一个可恢复的文件系统。在NTFS分区上用户很少需要运行磁盘修复程序。NTFS支持对分区、文件夹和文件的压缩。NTFS采用更小的簇,可以更有效率地管理磁盘空间。NTFS分区格式的优点是安全性和稳定性极其出色,在使用中不易产生文件碎片。 3)输入/输出设备 输入设备就是把数据送入计算机的设备,它接收用户的程序和数据,并转换成二进制代码,送入计算机的内存中存储起来,供计算机运行时使用。输入设备有键盘、鼠标、扫描仪、手写笔等。 输出设备就是把经过计算机处理的数据以人们能够识别的形式进行输出的设备。就如同人的眼睛可以看、耳朵可以听、嘴巴可以讲、手可以写字一样,输入/输出设备是计算机与外界沟通的桥梁。输出设备有显示器、打印机、绘图仪、音箱等。 2. 计算机软件 计算机软件分为系统软件、支撑软件和应用软件。系统软件由操作系统、实用程序、编译程序等组成。操作系统实施对各种软硬件资源的管理控制。实用程序是为方便用户所设,如文本编辑程序等。支撑软件有接口软件、工具软件、环境数据库等,能支持用机环境,提供软件研制工具。支撑软件也可以认为是系统软件的一部分。应用软件是用户按其需要自行编写的专用程序,它借助系统软件和支援软件来运行,是软件系统的最外层。 计算机的硬件是载体,软件是灵魂。软件可以理解为可运行的思想和内容的数字化,各领域都有自己的软件;硬件在数字域有相同的特征或者功能,完成对信息的处理、传输、存储。计算机的价值主要体现在软件,软件的核心是算法,一个好的算法可以优化硬件资源。硬件与软件在功能上可以相互补充和部分替代;具有软件功能、硬件形态的部件称为固件。图1-7所示为计算机组成示意图。 图1-7 计算机组成示意图 1.2.2 计算机网络的几个概念 计算机网络是将地理位置不同,且有独立功能的多个计算机(主机)系统利用通信设备和线路(通信子网)互相连接起来,借助功能完善的网络软件(协议),实现网络资源共享和信息传递的系统。 计算机网络向用户提供的最重要的功能有两个,即连通性和共享性。 (1)连通性:计算机网络使上网用户之间可以交换信息,好像这些用户的计算机都可以彼此直接连通一样。 (2)共享性:即资源共享。可以是信息共享、软件共享,也可以是硬件共享。 C/S(Client/Server)结构即客户端和服务器结构。C/S架构也可以看作胖客户端架构。因为客户端需要实现绝大多数的业务逻辑和界面展示。这种结构中,作为客户端的部分需要承受很大的压力。 B/S(Browser/Server)结构即浏览器和服务器结构。它是随着Internet技术的兴起,对C/S结构的一种变化或者改进的结构。在这种结构下,用户工作界面通过浏览器来实现,极少部分事务逻辑在前端实现。 网关是在采用不同体系结构或协议的网络之间进行互通时,用于提供协议转换、路由选择、数据交换等网络兼容功能的设施。 局域网(Local Area Network,LAN)是在一个局部的地理范围内,将各种计算机、外部设备和数据库等相互连接起来组成的计算机通信网。 虚拟局域网(Virtual Local Area Network,VLAN)是一种将局域网设备从逻辑上划分(注意,不是从物理上划分)成一个个网段,从而实现虚拟工作组的新兴数据交换技术。 网络地址转换(Network Address Translation,NAT)属于广域网(Wide Area Network,WAN)技术,是一种将私有地址转换为合法IP地址的转换技术,被广泛应用于各种类型的Internet接入和各种类型的网络中。NAT不仅完美地解决了IP地址不足的问题,而且还能够有效地避免来自网络外部的攻击,隐藏并保护网络内部的计算机。 1.2.3 互联网、因特网和万维网 互联网、因特网和万维网都是互连的网络,是必须分清的三个概念。 1. 互联网 互联网(internet,首字母i小写)是将两台计算机或者是两台以上的计算机终端、客户端、服务端通过计算机信息技术手段互相联系起来,人们可以与远在千里之外的朋友相互发送邮件、共同完成一项工作、共同娱乐。 2. 因特网 因特网(Internet,首字母I大写)是以TCP/IP网络协议连接各个国家、地区、机构计算机网络的数据通信网,它将数万个计算机网络、数千万台主机互联在一起,覆盖全球,是全球最大的电子计算机互联网,也称“国际互联网”。它的前身是1969年12月开通的ARPANET网(阿帕网,美国国防高级研究计划局),是一个信息资源极其丰富的计算机互联网络。 3. 万维网 只要应用层使用的是HTTP协议的因特网,就称为万维网(World Wide Web,WWW)。 互联网包含因特网,因特网包含万维网,凡是由能彼此通信的设备组成的网络就叫互联网。所以,即使仅有两台计算机,不论用何种技术使其彼此通信,也叫互联网。因特网是由上千万台设备组成的互联网,它使用TCP/IP协议,使不同的设备可以彼此通信。但使用TCP/IP协议的网络并不一定是因特网,局域网也可以使用TCP/IP协议。 1.2.4 因特网的主要特性 因特网采用分组交换技术(Packet Switching Technology),又称为包交换技术,将用户传送的数据分成一定的长度,每部分叫作一个分组,通过传输分组的方式传输信息。每个分组的前面有一个分组头,用以指明该分组发往的地址,然后由交换机根据每个分组的地址标志,将其转发至目的地,这一过程称为分组交换。 因特网使用TCP/IP,又名网络通信协议,是因特网最基本的协议,也是因特网实现国际互联的基础,由网络层的IP协议和传输层的TCP协议组成。TCP/IP定义了电子设备如何连入因特网,以及数据如何在设备之间传输的标准。协议采用4层的层级结构,每一层呼叫它的下一层提供的协议来完成自己的需求。通俗地讲,TCP负责发现传输的问题,一有问题就发出信号,要求重新传输,直到所有数据安全正确地传输到目的地,而IP给因特网的每一台联网设备规定一个地址。 因特网通过路由器将各个网络连起来。交换机将各个计算机连起来组成局域网,路由器将各个交换机连起来,也就是将局域网连起来,组成城域网、广域网。 因特网上的每台计算机都必须给定一个唯一的IP地址。 1.2.5 因特网的构成 1. 因特网的逻辑结构 从网络设计者的角度来看,因特网是由分布在世界各地的计算机网络相互连接而成的全球性的网络;从使用者的角度来看,它是一个信息资源网。图1-8所示为因特网的逻辑结构。 图1-8 因特网的逻辑结构 因特网是由大量主机通过连接在单一、无缝的通信系统上而形成的一个全球范围的信息资源网,接入因特网的主机既可以是信息资源及服务的提供者(服务器),也可以是信息资源及服务的消费者(客户机)。 2. 因特网的组成部分 因特网由硬件和软件两部分组成。 (1)硬件部分主要包括通信线路、路由器和主机。 ①通信线路包括有线和无线两类,通常用“数据传输速率”和“带宽”来衡量通信线路的传输能力。 ②路由器负责路由选择和存储转发,是因特网中最为重要的设备。 ③服务器与客户机:统称为“主机”,服务器是信息的提供者,客户机是信息的消费者。 (2)软件部分主要指信息资源。信息资源主要包括文本、声音、图像或视频等信息类型。 1.2.6 因特网的接入 按传输介质的不同,因特网的接入可以分为电缆接入、光纤接入以及无线接入。 1. 电缆接入 1)通过电话网拨号接入 用户计算机和ISP(Internet Service Provider,因特网接入服务供应商)处的远程访问服务器(Remote Access Server,RAS)通过调制解调器(Modem,俗称“猫”)与电话网相连,如图1-9所示。 (a)56kb/s调制解调器 (b)电话网拨号接入系统图 图1-9 电话网拨号接入 这种拨号上网是以前使用最广泛的因特网接入方式,主要有两种:一种方式是个人计算机经过调制解调器、电话线和公用电话网连接,网络传输速率较低,最大为56kb/s,上网过程中不能接打电话。另一种方式称为ISDN,即窄带综合业务数字网,与综合业务数字网连接,信息传输能力较强,最高传输速率为128kb/s,电话线路不受影响,这两种方式由于网络传输速率较低且费用较高,目前已经被淘汰。 2)利用ADSL接入 ADSL(Asymmetric Digital Subscriber Line,非对称数字用户线)是目前常用的一种因特网接入方式,如图1-10所示。 图1-10 ADSL接入 ADSL的非对称性表现在交换局端到用户端(ADSL调制解调器)下行速率和用户端到交换局端上行速率不同。高速下行信道向用户传送数据、视频、声频信息及控制、开销信号,在5km的范围内,传输速率一般在1.5~9Mb/s,低速上行信道包括通向网络的控制开销信号,传输速率一般在16~640kb/s。 ADSL需要的电话线资源分布广泛,具有传输速率高、使用费用低、无须重新布线和建设周期短的特点。 3)混合光纤同轴电缆接入 混合光纤同轴电缆(Hybrid Fiber Coax,HFC)是广电有线网络经常采用的一种接入方式,采用非对称的数据传输速率,下行速率要大于上行速率。上行速率一般为120Mb/s左右,下行速率一般为800~1000Mb/s,如图1-11所示。 HFC接入的特点是速率高,且接入主机可以24小时在线;缺点是采用共享式的传输方式,网上的用户越多,每个用户实际可使用的带宽就越窄。 图1-11 HFC接入系统图 4)局域网接入 局域网通过路由器或Modem接入因特网,通过代理服务器可以满足局域网中每个用户接入因特网的需求,如图1-12所示。用户通过代理服务器上网还可以隐藏自己,不用直接与目标计算机打交道,提高了上网的安全性。 图1-12 局域网接入系统图 2. 光纤接入 光纤接入是指局端与用户之间完全以光纤作为传输媒体,如图1-13所示。光纤接入可以分为有源光纤接入和无源光纤接入。光纤用户网的主要技术是光纤传输技术。根据光纤深入用户区域的程度,可分为光纤到路边(Fiber To The Curb,FTTC)、光纤到楼(Fiber To The Building,FTTB)、光纤到家(Fiber To The Home,FTTH)等。 图1-13 光纤接入 光纤通信不同于有线通信,后者是利用金属媒体传输信号,光纤通信则是利用透明的光纤传输光波。虽然光和电都是电磁波,但频率范围相差很大。一般通信电缆最高使用频率约为107Hz,光纤工作频率为1014~1015Hz。因此光纤接入能够向用户提供100~ 1000Mb/s的高速带宽,主要适用于因特网的高速互联。 3. 无线接入 1)4G/5G接入 使用具备4G/5G功能的移动电话接入因特网,下载资料和通话是可以同时进行的。4G/5G具有实时在线、按量计费、快捷登录、高速传输、自如切换等优点,是移动电话接入因特网的接入技术之一,如图1-14所示。 图1-14 4G/5G接入 2)WiFi接入 用户在接入网络的计算机中安装无线网卡,通过接入访问点连接网络,可实现数据共享和因特网接入,如图1-15所示。曾经用过的WiFi有802.11b(WiFi 1)、802.11a(WiFi 2)、802.11g(WiFi 3)、802.11n(WiFi 4)和802.11ac(WiFi 5),目前正在或将要推进的有802.11ax(WiFi 6)和802.11be(WiFi 7)。 图1-15 WiFi接入 1.2.7 IPv4协议 1. OSI七层模型 OSI七层模型从下到上分别为物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。 (1)物理层:定义了为建立、维护和拆除物理链路所需的机械、电气、功能和规程特性,其作用是使原始的数据比特流能在物理媒体上传输。 (2)数据链路层:在物理层提供比特流服务的基础上,建立相邻节点之间的数据链路,通过差错控制使数据帧(Frame)在信道上无差错地传输,并完成各电路上的动作序列。 (3)网络层:在计算机网络中进行通信的两台计算机之间可能会经过很多数据链路和很多通信子网。网络层的任务就是选择合适的网间路由和交换节点,确保数据及时传送。 (4)传输层:两台计算机通过网络进行数据通信时,第一个端到端的层次,具有缓冲作用。当网络层服务质量不能满足要求时,它将服务加以提高,以满足高层的要求;当网络层服务质量较好时,它只用进行很少的工作。 (5)会话层:其主要功能是组织和同步不同的主机上各种进程间的通信(也称为对话)。会话层负责在两个会话层实体之间进行对话连接的建立和拆除。 (6)表示层:为上层用户提供共同的数据或信息的语法表示和变换,即提供格式化的表示和转换数据服务。数据的压缩和解压缩、加密和解密等工作都由表示层负责。 (7)应用层:开放系统互联环境的最高层,为操作系统或网络应用程序提供访问网络服务的接口。应用层协议包括Telnet、FTP、HTTP、SNMP等。 2. TCP/IP的层次模型 TCP/IP的层次模型分为四层。 TCP/IP的最高层相当于OSI的5~7层,该层中包括所有的高层协议,如常见的文件传输协议FTP、电子邮件SMTP、域名系统DNS、网络管理协议SNMP、访问WWW的超文本传输协议HTTP等。 TCP/IP的次高层相当于OSI的传输层,该层负责在源主机和目的主机之间提供端到端的数据传输服务。这一层主要定义两个协议:面向连接的传输控制协议TCP和无连接的用户数据报协议UDP。相对于IP协议,UDP唯一增加的功能是提供协议端口以保证进程通信。许多基于UDP的应用程序在局域网上运行得很好,而一旦到了通信质量较低的互联网环境,可能根本无法运行,原因就在于UDP不可靠。因此,基于UDP的应用程序必须自己解决可靠性。UDP的优点在于其高效率。因为UDP没有连接过程,对传输不进行确认,因此一些对效率要求较高、传输数据量特别小的应用,或者数据量大、但是传输信道质量好(如光纤信道)的应用,UDP使用得较多。 TCP/IP的第二层相当于OSI的网络层,该层负责将分组独立地从信源传送到信宿,主要解决路由选择、阻塞控制及网际互联问题。这一层上定义了互联网协议IP、地址转换协议ARP、反向地址转换协议RARP和互联网控制报文协议ICMP等。 TCP/IP的最底层为网络接口层,该层负责将IP分组封装成适合在物理网络上传输的帧格式并发送出去,或将从物理网络接收到的帧卸装,取IP分组传递交给高层。这一层与物理网络的具体实现有关,自身并无专用的协议。网络接口层涉及通信信道上传输的原始比特流,它提供传输数据所需要的机械、电气性能及过程等手段,提供检错、纠错、同步等措施,使其对网络层显现一条无错线路,并且进行流量调控。图1-16所示为 TCP/IP协议族。 图1-16 TCP/IP协议族 3. IPv4编址 IP协议规范的部分内容规定了IP地址的结构。这个结构为每个主机和路由器接口提供32位二进制逻辑地址,其中包括网络部分与主机部分。 为方便书写及记忆,一个IP地址通常采用0~255的4个十进制数表示,数之间用句点分开。这些十进制数中的每一个都代表32位地址的其中8位,即所谓的8位位组,称为点分表示法。 按照原来的定义,IP寻址标准并没有提供地址类,为了便于管理,后来加入了地址类的定义。地址类的实现将地址空间分解为数量有限的特大型网络(A类),数量较多的中等网络(B类)和数量非常多的小型网络(C类),每类均规定了网络标识和主机标识在32位中所占的位数。这三类IP地址的表示范围如下。 A类地址:0.0.0.0~127.255.255.255。 B类地址:128.0.0.0~191.255.255.255。 C类地址:192.0.0.0~223.255.255.255。 另外还定义了特殊的地址类,包括D类(用于多点传送)和E类,通常指试验或研究类。 D类地址:224.0.0.1~239.255.255.254。 D类地址第一个字节以1110开始,用于多点播送,D类地址称为组播地址,供特殊协议向选定的节点发送信息使用。这些地址并不用于标准的IP地址。相反,D类地址指一组主机,这些主机作为多点传送小组的成员而注册,多点传送小组和电子邮件分配列表类似。 E类地址,如果第一个8位位组的前4位都设置为1111,则地址是一个E类地址。这些地址的范围为240~254,这类地址并不用于传统的IP地址,有时用于实验室或研究。 IP地址分为公有地址和私有地址。公有地址由世界各地区的权威机构InterNIC(Internet Network Information Center)负责管理和分配。这些IP地址分配给注册并向InterNIC提出申请的组织机构。私有地址(Private Address)属于非注册地址,专门为组织机构内部使用。以下为留用的内部私有地址: A类地址:10.0.0.0~10.255.255.255。 B类地址:172.16.0.0~172.31.255.255。 C类地址:192.168.0.0~192.168.255.255。 子网掩码是在IP地址的某个网络标识中,可以包含大量的主机,如A类地址的主机标识域为24位,B类地址的主机标识域为16位,而在实际应用中不可能将这么多的主机连接到单一的网络中,这将给网络寻址和管理带来不便。为解决这个问题,可以在网络中引入“子网”的概念。 将主机标识域进一步划分为子网标识和子网主机标识,通过灵活定义子网标识域的位数,可以控制每个子网的规模。将一个大型网络划分为若干个既相对独立又相互联系的子网后,网络内部各子网便可独立寻址和管理,各子网间通过跨子网的路由器连接,这样能提高网络的安全性。 子网掩码中的二进制位构成了一个过滤器,利用子网掩码可以判断两台主机是否在同一子网中。子网掩码与IP地址一样,也是32位二进制数,不同的是它的子网主机标识部分全为0。若两台主机的IP地址分别与它们的子网掩码相“与”后的结果相同,则说明这两台主机在同一网中。 MAC(Medium/Media Access Control)地址是厂商生产的网络设备的物理地址,对于每一台设备是唯一的,该地址定义了计算机间的网络连接,通常记录在网络接口卡上的硬件上。 ARP即地址解析协议,其任务是把IP地址转化为物理地址,这样就消除了应用程序需要知道物理地址的必要性。 MAC地址绑定可以防止内部IP地址被非法盗用,增强网络安全,当绑定机器要发送数据包时,接收数据包的设备如果检测到IP与对应的MAC地址不相符,就会自动丢弃该数据包。 网络层设备(例如路由器等)使用网络地址代表本网段内的主机,大大减少了路由器的路由表条目。 对于没有子网的IP地址组织,外部将该组织看作单一网络,不需要知道内部结构。例如,所有到地址172.16.×.×的路由被认为同一方向,不考虑地址的第三和第四个8位分组,这种方案的好处是减少路由表的项目。但这种方案无法区分一个大的网络内不同的子网网段,网络内所有主机都能收到在该大的网络内的广播,会降低网络的性能,也不利于管理。 1.2.8 IPv6协议 1. IPv6协议的产生 IPv6是互联网工程任务组(Internet Engineering Task Force,IETF)设计用于代替IPv4的下一代IP协议,由128位二进制数表示。IPv4使用32位地址,理论上可以容纳43亿个不同地址。但采用A、B、C三类编址方式后,可用的网络地址和主机地址的数目大打折扣,以致IP地址已于2011年2月3日分配完毕,其中北美占3/4,约30亿个,而人口最多的亚洲只有不到4亿个;中国互联网络信息中心(CNNIC)发布的《第37次中国互联网络发展状况统计报告》指出,截至2015年12月,我国IPv4地址数量为3.37亿个,拥有IPv6地址20594块/32。地址不足,严重制约了中国及其他国家互联网的应用和发展。要解决IP地址耗尽的问题,有以下3个措施。 (1)采用无类别域间路由编址(Classless Inter-Domain Routing,CIDR),使IP地址的分配更加合理。 (2)采用网络地址转换NAT方法,以节省全球IP地址。 (3)采用具有更大地址空间的新版本的IP协议IPv6。 IPv4是非连接的协议,即独立地传输每个信息分组报文,报文中指定起始地址和目的地址,其目标是尽力传送每个分组报文。每个分组报文既没有标记为属于哪个流,或哪个连接,也没有进行编号。尽力传送的非连接的IPv4协议的优点是容易实现,开销小,缺点是难以有效地支持服务质量(Quality of Service,QoS)。为了克服IPv4这些缺点,在IPv6中,网际协议做了修改。 (1)IPv6采用128位编码,相对于IPv4,增加了296倍的地址空间。这样几乎可以不受限制地提供IP地址,从而确保端到端连接的可能性。表1-1给出IPv4和IPv6的可用地址空间。与IPv4一样,IPv6一样会造成一定数量的IP地址浪费,因此准确地说,使用IPv6的网络并没有2128-1个能利用的地址。 表1-1 IPv4和IPv6的可用地址空间 版本 可用地址空间 IPv4 4,294,967,296 IPv6 340,282,366,920,938,463,607,431,768,211,456 如果说IPv4实现的只是人机对话,那么IPv6则扩展到任意事物之间的对话。IPv6不仅可以为人类服务,还将服务于众多的硬件设备,它将无时不在、无处不在地深入社会每个角落,是实现物联网的核心技术之一。 (2)IPv6使用更小的路由表。IPv6的地址分配一开始就遵循聚类(Aggregation)的原则,这使得路由器能在路由表中用一条记录(Entry)表示一片子网,大大减小了路由器中路由表的长度,提高了路由器转发数据包的速度。 (3)IPv6增加了增强的组播(Multicast)支持以及对流的支持(Flow Control),这使得网络上的多媒体应用有了长足发展的机会,为服务质量(QoS)控制提供了良好的网络平台。 (4)IPv6加入了对自动配置(Auto Configuration)的支持。这是对DHCP协议的改进和扩展,使得网络(尤其是局域网)的管理更加方便和快捷。 (5)IPv6具有更高的安全性。在使用IPv6网络时,用户可以对网络层的数据进行加密,并对IP报文进行校验,极大地增强了网络的安全性。 (6)IPv6支持长期演进。 2. IPv6编址 1)地址表达方式 IPv6采用128位表示IP地址,并取消了广播地址。 IPv6地址用×:×:×:×:×:×:×:×表示,其中×是一个4位十六进制数。由于地址太长,IPv6地址允许用“空隙”表示一长串零,也称为零压缩(Zero Compression)法,即一连串连续的零可以为一对冒号所取代,如2000:0:0:0:0:0:0:1等同于2000:1;0:0:0:0:0:0:128.10.2.1使用零压缩即可用128.10.2.1表示。 2)地址种类 IPv6数据报的目的地址可以是以下三种基本类型地址之一:单播(Unicast),就是传统的点对点通信;多播(Multicast),是一点对多点的通信;任播(Anycast),是IPv6增加的一种类型。多播的目的地址是一组计算机,但数据报在交付时只交付其中的一个,通常是距离最近的一个。IPv6将实现IPv6的主机和路由器均称为“节点”。IPv6地址是分配给节点上面的接口。一个接口可以有多个单播地址。一个节点接口的单播地址可用来唯一标识该节点。IPv6将128位地址空间分为两部分,第一部分是可变长度的类型前缀,相当于IPv4地址中的网络地址;第二部分是地址的其余部分,其长度也是可变的,标识单个接口或一组接口,如图1-17所示。 图1-17 IPv6地址空间分配 内嵌IPv4地址格式。为了实现与IPv4的兼容,便于IPv4的升级和平滑过渡,IPv6定义了内嵌IPv4的地址格式。前缀为0000 0000是保留一小部分地址与IPv4兼容,因为必须考虑到IPv4和IPv6将会长期同时存在,而有的节点不支持IPv6。因此数据报在这两类节点之间转发时必须进行地址转换,转换关系如图1-18所示。 图1-18 IPv4映射的IPv6地址 1.2.9 IPv4向IPv6过渡 在使用时,IPv4嵌入TCP/IP组件的许多层和许多应用程序中,如果要实现向IPv6切换,那么使用IP的各个应用、驱动程序和TCP栈就不得不进行改变。这会涉及数以百万行代码的改动。这么多的生产商不可能在一个特定的时间范围内改变它们的代码。这也意味着IPv4和IPv6必定会共存相当长的时间。IETF已经设计了三种策略,使过渡时期更加顺畅,分别是双协议栈、隧道技术和首部转换。IETF推荐所有的主机在完全过渡到IPv6之前使用双协议栈;换言之,一个站点必须同时运行IPv4和IPv6,直到整个因特网都使用IPv6。当两个使用IPv6的计算机要彼此通信,但其分组要通过使用IPv4的区域时,就要使用隧道技术这种策略;要通过这样的区域,分组就必须具有IPv4地址;因此当进入这种区域时,IPv6分组要封装成IPv4分组,当分组离开这个区域时再去掉这个封装,为了清楚地表示IPv4分组携带了IPv6分组,其协议值被置为41。当因特网的大部分系统已经过渡到IPv6,但某些系统仍使用IPv4时,首部转换就成为必要。发送端希望使用IPv6,但接收端不能识别IPv6,这种情况使隧道技术无法工作,因为这个分组必须是IPv4格式才能被接收端识别。 1.3 云计算 云计算(Cloud Computing)的概念是由Google公司在2006年正式提出来的,云计算的目的就是把计算能力变成像水电等公共服务一样,随用随取,按需使用。目前业内对云计算还没有统一定义,根据美国国家标准技术研究院(NIST)的定义,云计算是一种新型模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算能力、存储空间和信息服务。 云计算是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物。 1.3.1 云计算的技术特点 (1)弹性服务:服务规模可快速伸缩,以自动适应业务的负荷变化。 (2)资源池化:资源以共享资源池的方式统一管理。利用虚拟化技术,将资源分享给用户,资源的放置、管理与分配策略对用户透明。 (3)按需服务:以服务的形式为用户提供应用程序、数据存储、基础设施等资源,并可以根据用户需求自动分配资源。 (4)服务计费:可根据资源的使用情况对服务计费。 (5)泛在接入:用户可以利用各种终端设备随时随地通过网络访问云计算服务。用户对于IT专业知识的依赖度较低,用户终端的处理负担也较低。 1.3.2 云计算的基本构架 云计算的核心是将计算资源、存储资源、网络资源以虚拟化和自动化的方式通过网络呈现,但是除了技术实现手段外,更多地体现为一种商业模式。从用户体验角度出发,云计算包括基于基础设施的服务(Infrastructure as a Service,IaaS)、基于平台的服务(Plantform as a Service,PaaS),以及基于软件的服务(Software as a Service,SaaS)三种服务模式,它们之间的关系如图1-19所示。 图1-19 云计算服务模式示意图 (1)IaaS:基于基础设施的服务,提供整个信息处理的基础架构,包括计算资源、存储资源、网络资源等基础的云服务,典型应用是Salesforce online CRM。 (2)PaaS:基于平台的服务,提供可弹性调度的平台服务层,为不同业务应用提供标准化的应用工具和服务,类似于操作系统层次的服务与管理,典型应用是Google App Engine。 (3)SaaS:基于软件的服务,提供面向业务的系统化解决方案,就是大家熟悉的软件即服务。事实上SaaS概念的出现要早于云计算,只不过云计算的出现让原来的SaaS找到了自己更加合理的位置。SaaS强调按需使用付费,典型应用是Amazon AWS。 1.3.3 云计算的核心技术 云计算核心技术是虚拟化,所谓虚拟化是将硬件、操作系统和应用程序一同装入一个可迁移的虚拟机档案文件中。 虚拟化前软件必须与硬件相结合,每台计算机上只有单一的操作系统镜像,每个操作系统只有一个应用程序负载,虚拟化后每台机器上有多个负载,软件相对于硬件独立,如图1-20所示。 云计算以虚拟化为基础,采用分布式计算和存储,结合优化的硬件,通过集群化运维管理系统,实现计算、存储、网络等资源的动态分配及部署,真正实现“按需取用”。虚拟化能通过资源共享和分时共享技术提高系统资料利用率。 图1-20 虚拟化前后对比 1.4 大数据 在广电传媒领域内广泛存在大数据,如电视节目、电视互动业务、用户流动分析中的应用等,下面介绍有关大数据的基本知识。 1.4.1 大数据的定义 大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中,大数据是指不用随机分析法(抽样调查)这样的捷径,而是对所有的数据进行分析处理。大数据的4V特点为Volume(海量)、Variety(多样)、Velocity(高时效)、Veracity(低真实性),如图1-21所示。 1. Volume 根据IDC做出的估算,数据一直在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)。这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量,2024年全球将总共拥有160ZB的数据量,到2028年,数据量将达到384.6ZB。 2. Variety 大数据由结构化和非结构化的数据组成,其中有10%的结构化数据和90%的非结构化数据,它们与人类信息密切相关。非结构化数据类型多样,主要有邮件、视频、微博、位置信息、链接信息、手机呼叫、网页点击以及长微博等。 图1-21 大数据的特点 3. Velocity 从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少。 人们每分钟发送290万封电子邮件,每分钟向Youtube上传60小时视频,每天在Twitter发送1.99亿条微博,3.44亿条消息,每天在Facebook发出40亿条信息。 4. Veracity 价值密度低,商业价值高。以视频为例,在连续不间断的监控过程中,可能有用的数据仅有一两秒,但是具有很高的商业价值。 1.4.2 数据的换算 数据的最小基本单位是字节(B),按顺序从小到大为Byte、KB、MB、GB、TB、PB、EB、ZB、YB、NB、DB,关系如下: 1B=8b 1KB=1024B 1MB=1024KB=1048576B,1GB=1024MB=1048576KB 1TB=1024GB=1048576MB,1PB=1024TB=1048576GB 1EB=1024PB=1048576TB,1ZB=1024EB=1048576PB 1YB=1024ZB=1048576EB,1NB=1024YB=1048576ZB 1DB=1024NB=1048576YB 1.4.3 大数据产业市场主体 大数据产业市场主体主要包括互联网企业、传统IT生产商和大数据新兴企业三类,我国目前互联网企业主要以阿里巴巴、腾讯、百度等公司为代表,传统IT生产商主要以华为、联想、中兴、浪潮、曙光等公司为代表,大数据新兴企业主要以亿赞普、拓尔思和海量数据等公司为代表。图1-22所示为大数据产业市场主体之间的关系。 图1-22 大数据产业市场主体之间的关系 1.4.4 大数据的特点 大数据的特点还有以下几方面。 (1)多源异构:描述同一主题的数据由不同的用户、不同的网站产生。网络数据有多种不同的呈现形式,如声视频、图片、文本等,导致网络数据格式上的异构性。 (2)交互性:不同于测量和传感获取的大规模科学数据,微博等社交网络兴起导致大量网络数据具有很强的交互性。 (3)时效性:在网络平台上,每时每刻都有大量新的网络数据发布,网络信息内容不断变化,导致了信息传播的时序相关性。 (4)社会性:网络上用户根据自己的需要和喜好发布、回复或转发信息,因而网络数据成了对社会状态的直接反映。 (5)突发性:有些信息在传播过程中会在短时间内引起大量新的网络数据与信息的产生,并使相关的网络用户形成网络群体,体现出网络大数据以及网络群体的突发特性。 (6)高噪声:网络数据来自众多不同的网络用户,具有很高的噪声。 1.4.5 大数据技术 大数据技术主要包括大规模并行处理(MPP)数据库、数据挖掘网络、分布式文件系统、分布式数据库、云计算平台和可扩展的存储系统。 大数据技术分为整体技术和关键技术两方面。 1. 整体技术 整体技术主要有数据采集、数据存取、基础架构、数据处理、统计分析、数据挖掘、模型预测和结果呈现等。 2. 关键技术 大数据处理关键技术一般包括大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。 (1)大数据采集技术:数据采集是通过RFID(Radio Frequency Identification,射频识别技术)、传感器以及移动互联网等方式获得各种类型的结构化及非结构化的海量数据。 大数据采集一般涉及大数据智能感知层和基础支撑层。 ①大数据智能感知层:主要包括数据传感体系、网络通信体系、传感适配体系、智能识别体系及软硬件资源接入系统,实现对结构化、半结构化、非结构化的海量数据的智能化识别、定位、跟踪、接入、传输、信号转换、监控、初步处理和管理等。必须着重攻克针对大数据源的智能识别、感知、适配、传输、接入等技术。 ②基础支撑层:提供大数据服务平台所需的虚拟服务器,结构化、半结构化及非结构化数据的数据库及物联网网络资源等基础支撑环境。重点攻克分布式虚拟存储技术,大数据获取、存储、组织、分析和决策操作的可视化接口技术,大数据的网络传输与压缩技术,大数据隐私保护技术等。 (2)大数据预处理技术:大数据预处理主要完成对已接收数据的抽取、清洗等操作。 ①抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以将这些复杂的数据转化为单一的或者便于处理的类型,以达到快速分析处理的目的。 ②清洗:大数据中的数据,并不全是有价值的,有些数据并不是用户所关心的内容,而有些数据可能是完全错误的干扰项,因此要对数据进行过滤“去噪”,从而提取出有效数据。 (3)大数据存储及管理技术:大数据存储与管理要用存储器把采集到的数据存储起来,建立相应的数据库,并进行管理和调用,要解决大数据的可存储、可表示、可处理、可信任及有效传输等几个关键问题。 (4)大数据分析及挖掘技术:数据分析及挖掘技术是大数据的核心技术。主要是在现有的数据上进行基于各种算法的计算,从而起到预测的效果,实现数据分析的需求。 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。 (5)大数据展现与应用技术:大数据技术能够将隐藏于海量数据中的信息挖掘出来,从而提高各领域的运行效率。在我国,大数据重点应用于以下三大领域:商业智能、政府决策、公共服务。 1.4.6 大数据在媒体中的应用 大数据在媒体中的应用,可以深刻改变媒体的原有形式,主要有以下几种方式。 1. 改变新闻采编方式 记者在采访过程中随时录下所需的声频数据,并且在声频数据末尾输入特殊的“符号”,其后通过专业的数据提取平台提取相关数据并加以分析,由计算机后台按照一定的编写模式撰写稿件,在得到记者确认后提交稿件库。 2. 提升媒体信息的二次价值 所谓二次价值,主要涉及两方面,其一是指对数据的重复使用所能产生的额外的经济效益;其二是指在对数据的二次利用过程中对整个媒体的战略布局等产生深刻影响的作用。 信息的二次利用最易产生经济效益的方式就是授权其他媒体进行转发,但在目前知识产权保护不完善的情况下,这种二次利用的价值不高。信息二次利用的真正价值在于通过对庞大的数据库进行分析、整合,从而预测出市场走向。 3. 大数据促进纸质媒体、网络平台融合 纸质媒体作为一种以文字为载体的传播媒介,有着可以保存、流传的特征,便于对数据进行分析,实现价值的二次挖掘。但由于大数据时代是在云计算等大存储量数据的基础之上发展起来的,纸质媒体如果希望自身的数据能够得到大量的、快捷的分析和利用,首先应该完成由传统编辑平台向“电子平台”的转变,然后利用电子平台的大数据分析能力实现对新闻事件的分析、预测功能。 对于网络媒体而言,虽然可在网络平台获取海量数据,但信息源的不可靠性严重阻碍其在大数据时代的发展。而报纸等媒体虽然近年来遭受公信力下降的诟病,但与网络媒体相比,其数据的可靠性仍处在较高水平。 4. 大数据促进电视媒体、网络平台融合 电视媒体虽然具有强烈的画面冲击感以及新闻的时效性等天然优势,但近几年随着网络视频的发展,逐渐出现收视率下降的趋势。在大数据时代,在媒体行业内,或许电视媒体受到的冲击最大。因此,电视媒体谋求与网络媒体的融合发展势在必行。 有些电视台已经预见到转型势在必行,正在摸索“多屏融合”的合作方式,即电视机、计算机、手机等平台相互合作,进行视频资源的共享。 1.5 虚拟现实 虚拟现实(Virtual Reality,VR)技术又称“灵境技术”“虚拟环境”“赛伯空间”,在它基础上还诞生了AR(Augmented Reality,增强现实)、CR(Cinematic Reality,影像现实)和MR(Mixed Reality,混合现实)等。 1.5.1 虚拟现实的定义 虚拟现实技术是一种综合应用计算机图形学、人机接口技术、传感器技术以及人工智能等技术,制造逼真的人工模拟环境,并能有效地模拟人在自然环境中的各种感知的高级的人机交互技术。 虚拟现实系统包含操作者、机器、软件及人机交互设备四个基本要素,其中机器是指安装了适当的软件程序,用来生成用户能与之交互的虚拟环境的计算机,其中保存大量图像和声音的数据库。人机交互设备则是指将虚拟环境与操作者连接起来的传感与控制装置。人机交互设备将视觉、听觉、触觉、味觉、嗅觉等各种感官刺激传达给操作者,使人的意识进入虚拟世界。目前已经开发出来的,在视觉方面有头盔式立体显示仪等,如图1-23(a)所示;听觉方面有立体音响;触觉、位置感方面有“数据手套”“数据服装”等,如图1-23(b)所示,以及一些语音识别、眼球运动检测等装置,未来还会开发出模拟味觉和嗅觉的设备,那时虚拟现实将更加真实。 (a)数据头盔 (b)数据手套 图1-23 人机交互设备 1.5.2 基本特征 美国科学家Burdea G和Philippe Coiffet在1993年的世界电子年会上发表了一篇题为Virtual Reality System and Application(虚拟现实系统与应用)的文章,文中提出一个“虚拟现实技术的三角形”,指出虚拟现实技术具有的三个突出特征:沉浸感(Immersion)、交互性(Interaction)、构想性(Imagination),这就是虚拟现实的3I特性,如图1-24所示。 (1)沉浸感(Immersion):又称临场感,指用户感到作为主角存在于模拟环境中的真实程度。 图1-24 虚拟现实的3I特性 (2)交互性(Interaction)指参与者对虚拟环境内物体的可操作程度和从环境中得到反馈的自然程度。 (3)构想性(Imagination)指用户沉浸在多维信息空间中,依靠自己的感知和认知能力全方位获取知识,发挥主观能动性,寻求解答,形成新的概念。 此外一些学者还提出了多感知性(Multi-Sensory),它是指除了一般计算机技术所具有的视觉之外,还有听觉、力觉、触觉、运动感,甚至包括味觉、嗅觉等。 1.5.3 系统构成和实现过程 1. 系统组成 任何虚拟现实系统构成都可以划分为以下6个功能模块,如图1-25所示。 (1)检测模块:检测用户的操作命令,并通过传感器模块作用于虚拟环境。 (2)反馈模块:接收来自传感器模块的信息,为用户提供实时反馈。 (3)传感器模块:一方面接受来自用户的操作命令,将其作用于虚拟环境;另一方面将操作后产生的结果以相应的反馈形式提供给用户。 (4)控制模块:对传感器进行控制,使其对用户、虚拟环境和现实世界产生作用。 (5)3D模型库:现实世界各组成部分的3D表示,并由此构成相应的虚拟环境。 (6)建模模块:获取现实世界各组成部分的3D数据,并建立它们的3D模型。 图1-25 虚拟现实系统构成 2. 实现过程 利用计算机技术生成逼真的、具备视、听、触、嗅、味等多种感知的虚拟环境,借助计算机生成一个3D空间,将用户置身于该环境中,借助轻便的多维输入/输出设备(如跟踪器、头盔显示器、眼跟踪器、3D输入设备和传感器等)和高速图形计算机,使用户产生一种身临其境的感觉,去感知和研究客观世界的变化规律。 1.5.4 支撑技术 虚拟现实的支撑技术有计算机图形学、人工智能、人机交互技术和传感技术。它们之间的关系如图1-26所示。 图1-26 虚拟现实支撑技术之间的关系 (1)计算机图形学是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。 (2)人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的科学技术。 (3)人机交互技术是指通过计算机输入/输出设备,以有效的方式实现人与计算机对话的技术。 (4)传感技术是关于从自然信源获取信息,并对其进行处理和识别的一门多学科交叉的现代科学与工程技术。 1.5.5 关键技术 虚拟现实的关键技术主要涉及以下几方面。 1. 建模技术 虚拟环境建模的目的在于获取实际三维环境的三维数据,并根据其应用的需要,利用获取的三维数据建立相应的虚拟环境模型。 虚拟环境的建模是整个虚拟现实系统建立的基础,主要包括三维视觉建模和三维听觉建模,视觉建模包括几何建模、物理建模、运动建模和行为建模。 1)几何建模技术 几何建模描述了虚拟对象的形状(多边形、三角形、顶点和样条)以及它们的外观(表面纹理、表面光强度和颜色)。 几何模型一般可分为面模型和体模型两类。面模型用面片来表现对象的表面,其基本几何元素多为三角形;体模型用体素来描述对象的结构,其基本几何元素多为四面体。 几何建模通常采用的方法有人工几何建模和自动几何建模,人工几何建模主要利用软件进行人工设定和导入,其工作量大,效率低;自动几何建模主要通过三维数字化仪进行自动扫描,其工作效率相对高,图1-27所示为Polhemus FastScan 3D扫描仪进行的自动几何建模。 (a)原始状态 (b)数据处理后的模型 图1-27 Polhemus FastScan 3D扫描仪进行的自动几何建模 完成几何建模后是照亮场景,使对象能够被看见。场景的光照可分为局部光照和整体光照。局部光照的常用方法有Gouraud明暗处理和基于法向量插值的Phong明暗处理。整体光照模型中采用的一种方法是模拟对象的辐射度。 纹理映射是在图形流水线的光栅化阶段执行的一种技术,其目的是更改对象模型的表面属性,如颜色、漫反射率和像素法向量等。 2)物理建模技术 虚拟现实系统的物理建模是基于物理方法的建模。典型的物理建模方法有分形技术和粒子系统等。 (1)分形技术:可以描述具有自相似特征的数据集。自相似结构可用于复杂的不规则外形物体的建模。该技术首先被用于河流和山体的地理特征建模。 (2)粒子系统:由大量称为粒子的简单元素构成,每个粒子具有位置、速度、颜色和生命周期等属性,这些属性可根据动力学计算和随机过程得到。粒子系统常用于描述火焰、水流、雨雪、旋风、喷泉等现象。 3)运动建模技术 对象位置包括对象的移动、旋转和缩放。在VR中,不仅要设计绝对的坐标系统,还要涉及每一个对象相对的坐标系统。碰撞检测是VR技术的一个重要应用,在运动建模中经常使用。 4)行为建模技术 行为建模技术处理物体的运动和行为的描述,使虚拟环境随位置、碰撞、缩放和表面变形等的变化而动态产生变化。 行为建模方法主要有基于数值插值的运动学方法与基于物理的动力学仿真方法。 (1)运动学方法:通过几何变换,例如物体的平移和旋转等来描述运动。在三维计算机动画中,一种方法是利用插值方法设计中间帧,另一种方法是用户给定物体运动的轨迹样条,由样条来驱动动画。 (2)动力学仿真方法:动力学仿真中一个重要的应用是对运动的控制,常见的控制方法有预处理方法与约束方法。 2. 场景调度技术 场景调度技术是在不降低场景显示质量的情况下,尽量简化场景物体的表示,以减少渲染场景的算法时间,降低空间复杂度,并同时减少绘制场景物体所需的设备资源和处理时间。 1)基于场景图的管理 场景图是一种将场景中的各种数据以图的形式组织在一起的场景数据管理方式。 2)基于绘制状态的场景管理 基于绘制状态的场景管理的基本思路是把场景物体按照绘制状态分类,对于相同状态的物体只设置一次状态,并始终保存当前状态列表。 3)基于场景包围体的场景组织 对单个物体建立包围体,再在包围体的基础上对场景建立包围盒层次树,形成场景的一种优化表示。 4)场景绘制的几何剖分技术 几何剖分技术是将场景中的几何物体通过层次性机制组织起来,灵活使用,快速剔除层次树的整个分支,并加速碰撞检测过程。 3. 碰撞检测技术 碰撞检测技术的基本任务是确定两个或多个物体彼此之间是否有接触或穿透,并给出相交部分的信息。碰撞检测技术是随着人们对场景真实性的要求逐步发展起来的,只要场景中两个物体在移动,就必须判断是否与其他物体接触。碰撞检测技术分为面向凸体的碰撞检测、基于一般表示的碰撞检测、基于层次包围体树的碰撞检测和基于图像空间的碰撞检测。 1)面向凸体的碰撞检测 面向凸体的碰撞检测算法大体又可分为基于特征的碰撞检测算法和基于单纯形的碰撞检测算法两类。 (1)基于特征的碰撞检测算法主要通过判断两个多面体的顶点、边和面之间的相互关系进行二者之间的相交检测。所有基于特征的方法基本上源自Lin-Ganny算法。但是该算法无法判断是否刺穿,更不能求出刺穿深度。 (2)基于单纯形的碰撞检测算法又称为GJK算法,这类算法除了可以检测两物体是否相交,还能返回刺穿深度。 2)基于一般表示的碰撞检测 对于不同的模型表示方法,人们研究出了针对特定的具体模型的算法,例如CSG表示模型、面向参数曲面、面向体表示模型等。 3)基于层次包围体树的碰撞检测 物体的层次包围体树可以根据其所采用包围体类型的不同来加以区分,主要包括层次包围球树、AABB层次树、OBB层次树、k-dop层次树、QuOSPO层次树以及混合层次包围体树。 4)基于图像空间的碰撞检测 该技术通过移动图形硬件的剪裁平面,判断平面上的每个像素是否同时在两个实体之内来确定物体是否相交。 4. 特效技术 常用的特效技术可以分为以下3类:过程纹理模型、基于分形理论的算法模型和基于动态随机生长原理的算法模型。 5. 交互技术 传统的人机交互仅通过鼠标键盘,情景不会随着人们的主观意志而转移。随着科技的发展和人们对这方面的更高要求,人机交互得到了迅猛发展。近年来,数字头盔、数字手套等复杂传感设备应运而生,为人们带来了意想不到的惊喜。现在人们可以走进场景,化虚为实,将自己与虚拟场景融为一体。三维交互技术与语音识别、语音输入技术成为重要的人机交互手段。 1.5.6 VR技术的演进 1. AR技术 AR(Augmented Reality,增强现实)技术是通过在真实世界中叠加虚拟元素,将现实世界与虚拟世界相结合。AR技术通过感知和追踪真实世界的环境,然后在用户的感知中将虚拟对象、图像或信息叠加在现实场景中。 AR技术可以通过多种方式实现,包括使用智能手机、平板电脑、AR眼镜或头戴设备等。这些设备通常使用摄像头、传感器和计算能力来感知用户环境,并将虚拟内容与真实场景进行融合。 通过AR技术,用户可以看到与真实世界互动的虚拟元素。例如,在AR应用中,用户可以通过摄像头在真实环境中观察到虚拟角色、三维模型、信息标记或其他图像效果。这些虚拟元素可以与真实环境进行交互,如在演播室的主持人身边放置虚拟物体,在墙上显示虚拟绘画等,如图1-28所示。 AR技术在多个领域有广泛应用,包括媒体、游戏、教育、医疗、设计、娱乐和商业等。 图1-28 AR演播室场景 VR和AR的区别如下。 简单来说,VR中看到的场景和人物全是假的,是把人的意识代入一个虚拟的世界。AR中看到的场景和人物一部分真、一部分假,是把虚拟的信息带入现实世界中。 1)交互区别 VR设备:因为VR是纯虚拟场景,所以VR设备多用于用户与虚拟场景的互动交互,常用设备如位置跟踪器、数据手套(5DT之类的)、动捕系统、数据头盔等。 AR设备:由于AR是现实场景和虚拟场景的结合,所以基本需要摄像头,在摄像头拍摄的画面基础上,结合虚拟画面进行展示和互动。 2)技术区别 类似于游戏制作,VR创作出一个虚拟场景供人体验,其核心是计算机图形学的各项技术的发挥和应用。人们接触最多的就是应用在游戏上,可以说是传统游戏娱乐设备的一个升级版,主要关注虚拟场景是否有良好的体验。VR设备往往是浸入式的,典型的设备是头戴显示器。 AR应用了很多计算机视觉的技术。AR设备强调复原人类的视觉功能,例如自动识别跟踪物体,而不是靠人手动指出;自主跟踪并且对周围真实场景进行3D建模,而不是用户打开Maya软件,照着场景做一个极为相似的。典型的AR设备是普通移动端手机,升级版如Google Project Tango。 2. MR技术 MR(Mix Reality,混合现实)技术是虚拟现实技术的进一步发展,该技术通过在虚拟环境中引入现实场景信息,在虚拟世界、现实世界和用户之间搭起一个交互反馈的信息回路,以增强用户体验的真实感。在功能上全息透镜是要优于头戴显示器,如图1-29所示,用户可以戴着全息透镜进行摩托车设计,也可以对着虚实结合的场景讲述将来的天气情况。 (a)MR演播室预报天气 (b) 用MR技术设计摩托车 图1-29 MR 技术的工作场景 VR是纯虚拟数字画面,AR虚拟数字画面加上裸眼现实,而MR是数字化现实加上虚拟数字画面。从概念上来说,MR与AR更为接近,都是一半现实一半虚拟影像,但传统AR技术运用棱镜光学原理折射现实影像,视角不如VR视角大,清晰度也会受到影响。MR技术结合了VR与AR的优势,能够更好地将AR技术体现出来。 3. CR技术 CR(Cinematic Reality,影像现实)技术是Google公司投资的Magic Leap公司提出的概念,主要为了强调与VR和AR技术的不同,同样,其自认为与MR也不同,实际上理念是类似的,均是模糊物理世界与虚拟世界的边界,所完成的任务、所应用的场景、所提供的内容,与MR产品是相似的。 CR技术的核心在于,通过光波传导棱镜设计。Magic Leap眼镜从多个角度将画面直接投射于用户视网膜,从而达到“欺骗”大脑的目的。也就是说,有别于通过屏幕投射显示技术,通过这样的技术,实现更加真实的影像,直接与视网膜交互,解决了全息透镜视野太窄或者眩晕等问题。说到底,CR技术是MR技术的不同实现方式而已。 1.5.7 应用领域 虚拟现实作为一项新的技术,将对人们的生活、工作产生重大影响,如飞行模拟、医学虚拟、战场虚拟等。 1. 飞行模拟 飞行模拟是虚拟现实技术应用的先驱。通过模拟器训练飞行员是一条有效的途径,同时,飞行模拟器可以作为一种试验器材,对飞机的操纵性、稳定性和机动性进行测试和评定,更容易分析飞机气动参数的修改对飞行品质的影响,图1-30为虚拟现实在航天飞行中的应用。 图1-30 飞行模拟场景 2. 医学虚拟 虚拟现实可用于教学、复杂手术过程的规划、在手术过程中提供操作和信息上的辅助、预测手术结果等。此外,远程医疗服务也是一个很有潜力的应用领域。还可以用于医学心理学,尤其是在与心理失调有关的恐惧和忧虑疾病方面,如图1-31所示。 图1-31 虚拟现实应用于医学方面 3. 战场虚拟 战场虚拟既可以通过建立虚拟战场环境来训练军事人员,又可以通过虚拟战场来检查和评估武器系统的性能,如图1-32所示。 图1-32 战场虚拟 4. 电影电视 Sid Lee Collective为我们带来了一部特别的电影—11∶57。这部电影很简短,但是,它是一部恐怖题材的虚拟现实电影,给观众带来了不同寻常的体验。为了拍摄出360度的视觉效果,他们特意制作了器材,使用六台GoPro HERO3+相机,如图1-33所示。 图1-33 虚拟现实应用于电影电视 5. 娱乐游戏 如家庭中的桌面游戏,公共场所的各种仿真等。目前基于虚拟现实技术的游戏主要有驾驶型游戏、作战型游戏和智力型游戏三类,如图1-34所示。 图1-34 虚拟现实应用于娱乐游戏 1.6 新兴融媒体技术 1.6.1 人工智能和大模型 1. 人工智能 人工智能(Artificial Intelligence,AI)是计算机科学的一个分支,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的科学技术。 人工智能技术的四大分支包括模式识别、机器学习、数据挖掘和智能算法。 人工智能是类人行为、类人思考、理性的思考、理性的行动。人工智能的基础包括哲学、数学、经济学、神经科学、心理学、计算机工程、控制论、语言学。人工智能的发展经过了孕育、诞生、早期的热情、现实的困难等数个阶段。 1)人工智能技术在融媒体内容生产上的应用 从融媒体内容生产的业务流程上看,信息采集、选题策划、分发传播是三个重要的组成部分,人工智能技术在这些任务中都发挥着重要作用。对于媒体生产而言,最重要的资源是信息来源,大数据技术加上人工智能信息采集技术,可以通过对互联网海量信息进行采集分析,实现高效的新闻线索提供。例如,2020年由百度提供技术支持的“《人民日报》创作大脑”上线,该系统汇聚全网数据资源,利用自然语言处理、知识图谱技术对数据进行深度理解分析,为编辑提供可定制热点监控功能,节约人工监控成本,提升热点获取效率,丰富选题思路,可以帮助媒体创作者实现智慧选题。人工智能技术在融媒体内容生成领域的一个代表性应用就是机器人写作,其本质是通过对海量数据的分析整合,利用人工智能技术将信息与事先学习到的报道模板进行智能对应,从而自动生成新闻稿件。 2)人工智能技术在融媒体内容传播中的应用 从媒介发展的历史轨迹来看,每一次科技进步首先带来的就是传播方式的变革,人工智能技术的应用也助推融媒体获得了广阔的发展前景。 人工智能技术重塑了传统媒体单一向度的内容生产流程,使新闻内容的生产由单一线性转变为交互多向算法的运用,同时改变了用户与信息的连接方式,重新定义了媒体信息的分配渠道和内容推送方式。 例如,国家广播电视总局和湖南广播影视集团合办的5G智慧电台,以AI智能技术为原点,以优质内容生产和原创IP为支撑,将智能化的广播播出系统与高品质的声频内容相结合,通过智能抓取、编排、播报、监控、云端分发,一键式自动生成新闻、资讯、天气、路况、音乐等播出内容,大约5分钟即可生成一套24小时播出的高品质电台节目。 3)人工智能技术在融媒体内容管理上的应用 随着融媒体信息数据内容及规模的扩大,其内容审核和管理变得愈发困难。数据量的急速扩大使得传统的依靠人力进行内容审核、检索查找校对的方式已经变得难以为继。此时,人工智能技术展示了其在内容管理方面的显著特点。 基于人工智能技术的内容检索,可以实现对多种媒体信息的数据整合,提供素材编目、声频识别、图片内容识别、视频内容识别,实现智能归档和分类检索,提供高效的媒体内容管理。基于人工智能技术的媒体内容分析,通过对视频、语音、文本、图像等内容的多维理解,对多媒体进行结构化标签提取,可广泛应用于多媒体内容的管理、审核、搜索和推荐。例如,识别视频、图像中的关键政治人物、敏感人物、明星,以及出现的时间片段、区域、表情等属性等。 人工智能技术可用于融媒体内容智能审校。例如,采用前沿的深度学习、强化学习、迁移学习技术,依据行业规范、标准和业务知识,实现对素材、视频文字、图书稿件等的多维度审校,提供集合纠错、一致性检查、格式校对等实用能力。智能审校能够辅助传统校对工作,帮助内容审校者有效发现问题,提升校对质量及审稿效率,确保内容安全。 除去内容的审校外,人工智能技术还提供智能假新闻过滤和违规内容检测等功能。 2. 大模型 模型是深度学习或机器学习中的复杂数据结构,而大模型往往具有大量参数,这些参数可以在训练过程中自动调整,以捕获输入数据中的复杂关系。这类模型通常具有较深的网络结构和较多的神经元,以增强模型的表示能力和学习能力。大模型在诸如自然语言处理、计算机视觉和语音识别等领域取得了显著的成果。 模型的参数是指在机器学习和深度学习模型中可学习的权重和偏置等变量。在训练过程中,通过优化算法(如梯度下降)调整这些参数,以最小化模型预测值与实际值之间的差距。参数的初始值通常是随机的,随着训练的进行,会逐渐收敛到合适的数值,以捕捉输入数据中的复杂模式与关系。 在大模型中,参数的数量通常非常庞大。如GPT-3.0模型拥有约1750亿个参数,而GPT-4.0模型拥有约1.75万亿个参数,使其能够执行更复杂的任务,如自然语言生成、翻译、摘要等。大量参数使模型具有更强的表示能力,但同时也带来了更高的计算成本和内存需求,更高的硬件资源(如GPU或TPU)和优化策略(如分布式训练和混合精度训练)来进行有效训练。 大模型使用了深度神经网络等许多高级技术,主要包括以下几项。 (1)深度神经网络(Deep Neural Networks,DNNs):拥有多个隐藏层,以捕捉输入数据中的高阶特征和抽象概念。 (2)卷积神经网络(Convolutional Neural Networks,CNNs):在计算机视觉任务中,通过局部感受野、权值共享和池化操作等设计,CNN可以有效处理图像数据,提取多尺度的视觉特征。 (3)循环神经网络(Recurrent Neural Networks,RNNs)和长短时记忆网络(Long Short-Term Memory,LSTM):在自然语言处理和语音识别中,可以采用循环神经网络或其变体(如长短时记忆网络)来捕捉时序关系。 (4)Transformer 架构:Transformer 是一种自注意力机制(Self-Attention Mechanism)的神经网络架构,广泛应用于自然语言处理领域的大模型中。Transformer可以并行处理输入序列中的所有元素,大幅提高了模型的训练效率。 (5)预训练与微调(Pretraining and Fine-tuning):为了充分利用大量参数,大模型通常先在大规模数据集上进行预训练,学到通用的特征表示。然后在特定任务的数据集上进行微调,以适应特定的应用场景。 (6)分布式训练(Distributed Training)和混合精度训练(Mixed Precision Training):为了处理大模型的计算和存储需求,可采用一些高效的训练策略,如分布式训练(将模型和数据分布在多个设备或节点上进行并行计算)和混合精度训练(利用不同精度的数值表示,以减少计算和内存资源需求)。 大模型在各种复杂任务中取得了出色的性能。然而,大模型也带来了训练成本、计算资源和数据隐私等方面的挑战。 大模型通常采用分布式并行训练方法,以提高训练速度和扩展性。大体可以分为两类:数据并行(Data Parallelism)与模型并行(Model Parallelism)。 数据并行时,模型分布在多个计算设备(如 GPU 或 TPU)上,每个设备都有模型的一个副本,但训练数据会被划分为不同的子集。每个设备使用其分配的数据子集训练模型副本,然后通过通信协议(如 AllReduce 操作)同步梯度更新。 模型并行时,模型被分割成多个部分,每个部分在单独的计算设备上运行。这种方法适用于无法放入单个设备内存的大型模型。当参数规模为千亿时,存储模型参数就需要数百GB的显存空间,超出了单个GPU的显存容量。显然,仅靠数据并行无法满足超大规模模型训练对于显存的需求。为了解决这个问题,可以采用模型并行技术。在每个训练迭代中,设备间需要交换中间计算结果,以完成前向和反向传播过程。模型并行从计算图的切分角度,可以分为流水线并行(Pipeline Parallelism)和张量并行(Tensor Parallelism)。 流水线并行将模型的不同层划分到多个计算设备上,每个设备负责处理一部分模型层,即层间并行。在前向和反向传播过程中,设备之间需要传递中间计算结果。这种方法的优势是可以同时处理多个输入样本,从而提高计算设备的利用率。 张量并行将计算图中的层内参数切分到不同设备,即层内并行,又称为张量模型并行。 1.6.2 AIGC与ChatGPT 1. AIGC AIGC是人工智能生成内容(Artificial Intelligence Generated Content)的简称,是指利用人工智能技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络(GAN)等方法,自动生成各种类型的内容,例如文章、视频、图像、音乐、代码等。 (1)AIGC是利用人工智能技术自动生成文本、图像、音乐、视频、3D交互内容等各种形式的内容。 (2)AIGC是继PGC(Professionally Generated Content)和UGC(User Generated Content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势。 AIGC可以根据用户输入的关键词或要求自动生成内容,无须人工干预或编辑;AIGC可以利用预训练大模型、生成式对抗网络等方法,自动生成各种类型的内容;AIGC可以利用大数据和云计算等技术,快速地处理海量的信息,并生成高质量的内容;AIGC可以利用社交媒体、电商平台、游戏平台等渠道,将生成的内容进行广泛地传播和分享;AIGC可以利用用户画像、行为分析、情感识别等技术,将生成的内容进行个性化定制和适配。 (3)AIGC代表AI技术发展的新趋势,过去传统人工智能偏向分析能力,而现在人工智能正在生成新内容,实现从感知理解世界到生成创造世界的晋级。 AIGC代表AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。 商业层面上,AIGC本质上是一种AI赋能技术,能够通过其高通量、低门槛、高自由度的生成能力,广泛服务于各类内容的相关场景及生产者。 发展趋势上,全球科技界都在为此轮生成式AI热潮狂欢,且提振AI产业发展信心的消息层出不穷。 技术层面上,AIGC得益于算法技术进展,其中包含对抗网络、流生成模型、扩散模型等深度学习算法。 应用层面上,AIGC已经让众多行业捕捉到新的技术与产业机会,应用革命的大幕就此拉开。 (4)AIGC的发展历程。 AIGC的发展可分为三个阶段:早期萌芽阶段(20世纪50年代—90年代中期)、沉淀累积阶段(20世纪90年代—21世纪10年代中期)和快速发展阶段 (21世纪10年代中期至今)。 ①早期萌芽阶段。由于技术限制,AIGC仅限于小范围实验与应用,1957年出现首支由计算机创作的音乐作品:弦乐四重奏《依利亚克组曲》(Illiac Suite)。20世纪80年代末—90年代中,由于高成本及难以商业化,资本投入有限, 因此AIGC无较多较大成绩。 ②沉淀累积阶段。AIGC从实验性转向实用性,2006年深度学习算法取得进展,同时GPU、CPU等算力设备日益精进,互联网快速发展,为各类人工智能算法提供海量数据进行训练。2007年首部人工智能装置完成的小说1 The Road(《在路上》)问世,2012年微软公司展示了全自动同声传译系统,主要基于深度神经网络(Deep Neural Network,DNN),自动将英文讲话内容通过语音识别等技术生成中文。 ③快速发展阶段。2014年深度学习算法生成式对抗网络,推出并迭代更新,助力AIGC新发展。2017年微软人工智能少年“小冰”推出世界首部由人工智能写作的诗集《阳光失了玻璃窗》,2018年英伟达公司发布的StyleGAN模型可自动生成图片,2019年DeepMind公司发布的DVD-GAN模型可生成连续视频。2021年Open AI公司推出的DALL-E以及更新迭代版本DALL-E-2,主要用于文本、图像的交互生成内容。 (5)AIGC的应用场景和价值。 ①在影视中的剧本生成、角色生成、场景生成等方面,可提高影视的创作效率和质量; ②在媒体中的新闻写作、评论写作、标题写作等方面,可提高媒体的生产力和影响力; ③在广告的文案写作、素材制作、视频制作等方面,可提高广告的创意性和吸引力; ④在电商的商品描述生成、商品推荐生成、商品图片生成等方面,可提高电商的转化率和销售额; ⑤在游戏制作等方面,可以提高角色生成、场景生成、关卡生成、剧情生成等的效率和质量。 AIGC按内容生成类别可分为文本、代码、图像、声视频四类。 文本生成包含应用型文本、创作型文本、文本辅助和交互文本。应用型文本大多为结构化写作,以客服类的聊天问答、新闻撰写等为核心场景。最典型的是基于结构化数据或规范格式,在特定情景类型下的文本生成,如体育新闻、金融新闻、公司财报、重大灾害等。创作型文本主要适用于剧情续写、营销文本等细分场景等,具有更高的文本开放度和自由度,需要一定的创意和个性化,对生成能力的技术要求更高。创作型文本需要特别关注情感和语言表达艺术。文本辅助主要是定向采集信息素材、文本素材预处理、自动聚类去重,并根据创作者的需求提供相关素材。交互文本主要是虚拟伴侣、游戏中的NPC个性化交互等。 声频生成主要包括TTS(Text-to-speech)场景和乐曲/歌曲生成。TTS场景广泛应用于客服及硬件机器人、有声读物制作、语音播报等。例如喜马拉雅App运用TTS技术重现单田芳版本的《毛氏三兄弟》和历史类作品。如乐曲/歌曲生成,AIGC在词曲创作中的功能被逐步拆解为作词(NLP中的文本创作/续写)、作曲、编曲、人声录制和整体混音。2021年年末,贝多芬管弦乐团在波恩首演人工智能谱写完成的贝多芬未完成之作《第十交响曲》。 视频图像处理包括图像属性编辑和部分编辑。图像属性编辑可以直观地将其理解为经AI降低门槛的PhotoShop。用户可以通过简单的操作,对图像进行旋转、裁剪、缩放,调整色彩,添加滤镜、文字、水印等效果。部分编辑是指对图像的局部区域进行修改或替换,如去除背景、去除物体、换脸、换衣等。这种编辑需要AI具有较强的图像理解和生成能力,以保证编辑后的图像自然、逼真。 2. ChatGPT 近期的人工智能典型事件就是 ChatGPT(Chat Generative Pre-trained Transformer,交谈用生成式预训练交换器)的出现(我国也有相应的应用,是由百度公司开发的“文心一言”)。ChatGPT是OpenAI公司研发的聊天机器人程序,于 2022 年 11 月 30 日发布,到 2023 年 1 月末,ChatGPT 的月活用户已突破 1 亿,至今已升级到了 4.0 版本。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样聊天交流,能完成以下工作。 (1)智能问答:根据用户的问题和上下文生成符合语法和语义的答案,可以用于智能问答、知识库问答等应用。 (2)搜索信息:通过提供高级搜索和过滤功能帮助用户搜索技术信息,使用户能够快速、准确地找到他们需要的确切技术信息。 (3)文本编辑:帮助用户编辑文章、提供语法检查、拼写检查和样本句子等功能,还可以分析文章,并提取有意义的信息,帮助用户优化文章的整体结构。 (4)协助完成工作:通过自动化功能和完成重复性任务来协助用户更有效地完成日常工作,还可以根据用户的兴趣和喜好提供个性化的内容,给用户带来新的想法和观点。 (5)数据分析:分析数据并从中提取有意义的信息,还可以发现新的模式和趋势,并对数据进行预测。 (6)文本翻译:可以将一种语言翻译成另一种语言,翻译质量和流畅度已经达到了很高的水平,可以用于机器翻译等应用。 (7)语音识别:可以处理语音输入,并将其转换为文本,可以用于语音识别和语音转换等场景,为人类提供更加便捷的交互方式。 ChatGPT 最显著的特征之一是能够生成连贯流畅的文本,与用户互动并提供有效信息。因此,在融媒体行业,可以为媒体、网站和社交平台智能生成内容,节省成本,也可以减少媒体对人力的需求。 ChatGPT 对融媒体行业而言机遇大于挑战,它可以作为辅助工具参与到新闻的生产过程中。尤其是在财经、体育等程式化报道中,可以为记者提供线索、搜集素材,能快速撰写文章,从而提高新闻生产效率。 ChatGPT 可以根据操作者的指引和限定,自动给出相关文本内容,可以大幅提升媒体人在信息搜集、信息梳理、谋篇布局等方面的效率。 1.6.3 5G技术 5G即第五代移动通信技术,是具有高速率、低时延和大连接特点的新一代宽带移动通信技术,是实现人、机、物互联的网络基础设施。国际电信联盟(ITU)定义了5G的三类应用场景:增强移动宽带(eMBB)、超高可靠低时延通信(uRLLC)和海量机器类通信(mMTC)。增强移动宽带主要面向移动互联网流量的爆炸式增长,为移动互联网用户提供更加极致的应用体验;超高可靠低时延通信主要面向工业控制、远程医疗、自动驾驶等对时延和可靠性具有极高要求的垂直行业应用需求;海量机器类通信主要面向智慧城市、智能家居、环境监测等以传感和数据采集为目标的应用需求。 我国目前有5G运营牌照的运营商有4家,分别是中国移动、中国联通、中国电信和中国广电,他们在5G移动通信使用的主要频段如表1-2所示。 表1-2 我国各运营商的5G移动通信主要频段 运营商 频率范围/MHz 带宽/MHz Band 备注 中国移动 2515~2675 160 n41 4G/5G频谱共享 4800~4900 100 n79 中国广电 4900~4960 60 n79 703~733/758~788 2×30 n28 中国电信/中国联通/中国广电 3300~3400 100 n78 三家室内覆盖共享 中国电信 3400~3500 100 n78 两家共享共建 中国联通 3500~3600 100 n78 1. 5G时代融媒体的背景特点 (1)5G最高数据传输速率可达10Gb/s,是4G技术的数百倍。这意味着下载大容量内容只需数十秒或数秒,使得全息投影、虚拟现实等技术得以应用,为融媒体行业提供了多元化、高水准的支持。 (2)5G信息传播耗时更短,有效解决了延迟问题。这对于追求即时播报的融媒体行业来说,具有极大的优势。 (3)5G时代的网络容量更大,设备容纳数量可提升至千亿级水平,促进物联网体系的优质构建。这使得融媒体产品在生产过程中,各类软硬件设备可围绕同一核心任务联动运行,提高工作质量和效率。 (4)5G的应用普及将激发更强的创新动力,推动人工智能、虚拟现实、远程操控、无人控制等技术与融媒体领域的深度融合。 2. 5G时代融媒体的机遇优势 2019年1月25日,习近平总书记在十九届中央政治局第十二次集体学习会中指出:“要坚持移动优先策略,让主流媒体借助移动传播,牢牢占据舆论引导、思想引领、文化传承、服务人民的传播制高点。” 5G时代的技术革新为融媒体行业的发展提供海量资源支持。基于5G物联网的“万物互联”的特点,各类联网设备均可作为数据信息的采集端或输出端,将“媒体”概念从电视、手机、计算机等传统主体上解放出来,形成更多元化的平台体系,如利用智能眼镜、智能耳机、智能家电等设备也可收听、收看融媒体节目,信息传播的开放性与便利性得到了显著提升。同时,融媒体领域的工作人员或智能系统通过更多的数据信息采集端了解用户特点,可制作、推送定制化、个性化的节目产品。5G革新了融媒体行业的产品创设思路和场景呈现模式。 3. 5G时代融媒体面对的风险和挑战 首先,5G时代受众对融媒体行业和产品的期待有所提高,这要求相关单位和人员要更新节目生产和新闻服务理念,运用各类新技术和新平台,以适应观众需求。忽视这一趋势将导致受众流失和口碑弱化。其次,定制化产品和人性化的服务已成为融媒体发展的必要条件,精准的受众定位和分层传播至关重要。在市场竞争方面,融媒体时代的压力促使传统媒体寻求突破,利用网络技术拓展平台。在5G时代,媒体市场将涌现更多新角色,竞争将更为激烈。因此,媒体单位必须挖掘和开发不可替代的独特优势,以保持受众的稳定性和行业话语权。最后,任何技术的运用都需要适度,超过限制标准可能会削弱其优势,甚至带来风险。因此,在面对5G时代的新技术、工具和模式时,融媒体行业必须保持清醒的头脑和客观的态度,有计划、有方法地进行技术实践和产品融合,避免技术的滥用。 4. 5G融媒应用 1)5G直播应用 基于5G网络,利用专业的5G终端设备,能够高效轻松地解决企业及单兵记者的移动外采4K直播信号回传问题。 如图1-35所示,4K/8K+5G+Al场景分析与压缩+多链路传输将极大提高4K/8K专业直播的效率,并降低成本。 图1-35 5G直播应用系统 2)5G MEC智慧场馆应用 将5G与MEC(Multi-access Edge Computing,多业务边缘计算)结合形成智慧场馆应用系统,如图1-36所示。 图1-36 5G MEC智慧场馆应用系统 在体育场看赛事或演出时,对视频和帧率的要求非常高,而广电级的视频终端设备不具备定制化需求以及网络化接入能力,监控机和会议级的视频通信设备画质和帧率都无法满足该场景的需求。并且在实地场景中,人的视角是固定的。通过在体育场布多个机位,连接5G视频终端设备,利用5G网络,将场馆内声视频数据与边缘计算系统集群结合,用户进入场馆内,移动终端手机/iPad可下载App,进行实时观看、自导播、切换等。 3)5G应急(广播)指挥 为预防灾害及重大事件的发生,为受灾现场搭设生命通道,现在全国各地均设置了应急(广播)指挥中心,图1-37为5G应急(广播)指挥系统框图。 图1-37 5G应急(广播)指挥系统框图 目前,国家的应急广播指挥中心隶属于各级政府,现在大多与当地的融媒体中心对接,有不少地方指挥中心就设在当地的融媒体中心,各级政府应急管理部门(包括政务、地震、水利、交通等均要与应急广播指挥系统对接。因此,作为一种补充手段,通过在应急现场架设5G基站,与承载网、骨干网相连,连接摄像机和终端设备,可将应急前线的声视频数据回传到应急广播指挥中心。 1.6.4 区块链技术 区块链技术(Blockchain Technology,BT)也被称为分布式账本技术,是一种互联网数据库技术,其特点是去中心化、公开透明,让每个人均可参与数据库记录。区块链的基本概念包括以下几项。 (1)交易(Transaction):一次操作,导致账本状态的一次改变,如添加一条记录。 (2)区块(Block):记录一段时间内发生的交易和状态结果,是对当前账本状态的一次公示。 (3)链(Chain):由一个个区块按照发生顺序串联而成,是整个状态变化的日志记录。 如果把区块链作为一个状态机,则每次交易就是试图改变一次状态,而每次共识生成的区块,就是参与者对于区块中所有交易内容导致状态改变的结果进行确认。 区块链是通过去中心化和去信任的方式集体维护一个可靠数据库的技术方案,以分布式数据存储、点对点传输、共识机制、加密算法等计算机技术在非信任环境中建构的信任服务基础设施,其核心价值是重构信任。区块链在融媒体上的应用场景包括了信源认证、公民审核、版权保护、付费订阅、数字资产和数字广告等。 1. 通过区块链技术解决融媒体平台的数字版权 区块链对数字版权的保护,主要依托数字摘要、非对称加密等保证上链数据的完整性,对数字版权信息进行注册、追踪和保护。除此之外,区块链还能通过时间戳为版权内容标记提供唯一的证明,更加有利于数字版权的追溯。 区块链对数字版权的保护方式是通过联盟链引入国家监管机构,通过对数字作品内容进行线上版权信息保存,以期实现对数字版权作品内容的追溯。联盟链与监管机构的结合,为维权取证过程提供了强有力的支撑,使得版权取证、数字作品确权更加方便。 个人和内容机构将创作的内容信息通过节点上链,区块链记录版权所属信息、作品哈希、确权时间、作品内容的特征等信息。作品内容通过哈希算法生成唯一的特征值,作为各类视声频形式版权创作的“数字指纹”在区块链上存证,将唯一特征值通过区块链共享到司法机构。同时线下将作品文件提交到版权局进行审核,将通过审核的电子证书版权上链并发放版权证书,完成确权过程,如图1-38所示。 图1-38 版权信息上链过程 2. 通过区块链技术解决内容审核 内容审核是将区块链技术建立内容审核平台联盟链,对接入链上的内容提供“内容审核结果提交”“审核结果授权”“内容重审”等交互接口。各平台在对内容进行常规审核后,将审核方式、审核内容哈希值信息、内容提供方哈希值信息、审核结果以及审核人员等审核相关信息上链,并在链上同步记录相关参与方对该平台的贡献值;而其他平台在需要对同一内容进行审核时,可通过内容索引、内容编目或内容摘要等信息,在区块链内容审核平台上查询是否有该内容的审核记录,如有则可通过授权接口直接获取链上该内容的审核结果信息,如图1-39所示。 图1-39 基于区块链的内容审核信息上链逻辑 结合区块链技术搭建联盟链,可以将用户身份信息进行哈希运算后,将哈希值及其对应的内容提供信誉值上链,在联盟链内基于用户身份哈希信息进行汇总,各平台再结合自身会员系统进行映射,便可得出对应实名用户在全联盟内的信誉值。通过规范融媒体 UGC 内容提供者的内容制作自律性及自检机制,建立内容发布者信誉评估制度,推动建立健康的内容制作生态。 目前已有多个融媒体平台或其他媒体平台使用区块链技术进行内容审核。陕西省融媒体平台利用区块链公开、透明、可追溯、难以篡改等特性,推动并实现内容审核功能。另外,爱奇艺平台结合自研的基于 AI 的视频内容审核系统,发布内容在区块链确权前先行进行机器 +人工审核,通过审核后方能将相关信息上链,保证了传播内容的质量。 3. 通过区块链技术解决内容溯源 区块链分布式账本公开透明且易于追溯,能够记录媒体内容,由此可以解决媒体审核过程中存在的虚假内容难以追踪溯源等问题,实现对媒体内容的追踪溯源。 1)通过密码学技术建立内容标识 媒体内容的各个环节都需要利用区块链技术把关,特别是在内容创作、发布等环节。区块链技术中的核心密码学技术具有信息内容公开、不可篡改的技术特点,通过密码学技术为每个媒体创作内容标记唯一的数字标识,使得媒体数字内容具有唯一性。 2)基于统一内容标识的媒体内容追根溯源 基于哈希函数,当媒体内容文件发生任何改变时,计算出的哈希值都会发生变化。因此在内容追踪溯源和内容审核应用当中,为媒体内容建立统一的 ID 标识体系和 ID 标识规范。在统一标识的基础上,再针对媒体内容文件每次合法的改变(如再编辑、转码、拆条、插入台标广告等操作)增加每次改变文件的哈希值记录,通过统一标识下包含所有相关合法内容数据哈希值的方式,实现内容追踪和跨平台内容审核协同。 以某电视台区块链数字版权保护系统为例,媒体内容追踪溯源区块链技术系统由区块链底层链、区块链系统管理、权限管理、大数据分析和管理以及数字身份管理等组成,提供媒体内容区块链追踪溯源服务,如图1-40 所示。 图1-40 基于区块链的溯源系统 4. 通过区块链技术解决融媒体平台的存储瓶颈 由于融媒体平台采用中心化服务,有效提升了服务效率和效果,但也很容易使平台的性能和存储容量遇到瓶颈。例如,用户利用融媒体平台进行文件的上传下载以及视频剪辑时,如果用户数量过多,就会拖慢平台服务器的运行速度,连接数量超出限额时甚至会造成服务瘫痪。即使可以利用提升服务器数量的方式实现负载均衡,但所付出的成本较高。另外,融媒体平台在存储文件素材和媒体资源的过程中,仅采取了线下备份这一种方式,导致文件地址定位较为粗糙。应用区块链的分布式存储结构,能够将相关文件进行细化,分别储存至各个节点中,提升平台服务器的存储性能,其可承载用户数量也会有较大提升,文件存取性能大幅增长,解决了存储资源不足这一瓶颈。 5. 通过区块链技术构建融媒体共信机制 通过区块链技术构建融媒体共信机制是基于区块链技术去中心化的特征,“互信和共享”是其最显著的优势。融媒体利用区块链进行信息传播时,能够达成互信共享这一标准,进而完成共信机制的构建。具体而言,融媒体在可信度方面能够利用区块链作为技术方面的支持,进而有效减少融媒体行业治理过程付出的制度性成本。从信源可信度视角进行分析,融媒体能够利用共同维护的账本记录完成对信息发布人员具体数字身份的发放,进而在整个区域中对这类人员进行数字资质验证,有效保障其发布信息的准确性和合法性。同时,融媒体也能够通过区块链技术对新闻数据信息进行加密,分散储存至不同的用户节点中,单一用户就无法篡改新闻数据信息。整个过程中,人工智能技术会给予相应的动态信任积分,用于对所有用户做出切实中肯的评价。从内容可信度视角进行分析,融媒体能够利用全链节点来实现共同维护内容可信度的目的。区块链融媒体数据库中的任意一个信息发布源都会将所交换的数据信息进行妥善保存,并以此为基础完成指纹验证,确保信息内容在缺乏可信第三方的情况下实现自证。 从渠道可信度视角进行分析,在区块链融媒体中对全部信息发布源进行交换时,不用再次进行信任操作,因为其内部构建了一个完善的智能合约机制,能够保障信息交换按照既定的规则自动完成,且无法进行人为干预。当信任积分低于相应的标准时,系统就会强制关停此类信源账号。 6. 通过区块链技术促进融媒体操作模式创新 在步入信息化时代后,媒体的操作模式已经演变为“中央厨房”模式,顾名思义,即由信息生产人员摒弃信息生产与传播的传统路径,直接与广大受众对接,使受众能够获取更为多元化的信息内容,所采用的信息获取形式也更为丰富,充分迎合受众接收信息的同时,又广泛参与互动的视听需求。 在融媒体行业应用区块链技术,完成对“中央厨房”这一操作模式的有效助力,能够使融媒体领域去中心化进程不断提速,有效构建多部门合作共享这一机制,促进政府与企业的深度融合,协同创新,共同推动区块链融媒体生态圈的形成与完善。 1.6.5 元宇宙 元宇宙(Metaverse)始于1992年国外科幻作品《雪崩》里提到的Metaverse和Avatar这两个概念。人们在Metaverse中可以拥有自己的虚拟替身,这个虚拟的世界就叫作“元宇宙”。元宇宙是利用科技手段进行链接与创造的,与现实世界映射与交互的虚拟世界,具备新型社会体系的数字生活空间。 元宇宙本质上是对现实世界的虚拟化和数字化过程,需要对内容生产、经济系统、用户体验以及实体世界内容等进行大量改造。但元宇宙的发展是循序渐进的,是在共享的基础设施、标准及协议的支撑下,由众多工具、平台不断融合、进化而最终成形的。它基于扩展现实技术提供沉浸式体验,基于数字孪生技术生成现实世界的镜像,基于区块链技术搭建经济体系,将虚拟世界与现实世界在经济系统、社交系统、身份系统上密切融合,并且允许每个用户进行内容生产和实时编辑。 元宇宙不是一个新的概念,它更应该理解为一个经典概念的重生,是在扩展现实(XR)、区块链、云计算、数字孪生等新技术加持下的概念具体化。 北京大学陈刚教授与董浩宇博士梳理并系统界定了元宇宙的五大特征与属性,即社会与空间属性,科技赋能的超越延伸性,人、机与人工智能共创性,真实感与现实映射性,交易与流通性。 1. 元宇宙技术的落地应用及产业推广促进了融媒体发展 元宇宙由云计算、人工智能、扩展现实、区块链、数字孪生、边缘计算等多种技术群支撑,可应用于企业的方方面面,从消费者到员工再到整个企业,推动现实世界向虚实结合的融合世界发展,其本质上是对多项高新技术的整体拟合及应用。 当前融媒体大多依赖于技术革新主导的产业应用,不同领域的单项成熟技术可以应用于媒体融合当中。元宇宙概念的出现,集合了当下前沿领域多项新兴技术,以目前相对成熟的场景化沉浸式传播来说,通过AR、VR等技术进行宣传,虽然尚未实现常态化、产业化模式,但随着元宇宙概念逐渐具象化,技术群的不断扩散,沉浸式传播很可能将成为未来常态化的传播手段,极大地加深媒体间相互融合的同时,还能提升融合媒体的传播效果。此外,以基于元宇宙衍生出的虚拟数字人为例,也可能为融媒体带来新的发展可能性。随着元宇宙的概念被更多人了解并产生参与意愿,媒体平台需要借助自己独有的虚拟数字人率先抢占元宇宙世界市场,从而投入更多研发力量,设计具有独特媒体属性的虚拟数字人,实现产业的快速转型升级。很多人称之为“后人类传播”,通过元宇宙传播中机器、智能化的力量带动虚拟数字人实现人机交互的新传播形态。在融媒体管理上,基于区块链技术基础的智能化内容生产、分发、管理也为其提供了更快、更高的效率。在保证原创内容的价值更加充分、完整体现的同时,当违规和不实的信息出现时,可以及时反映并进行封堵管理,随后进行溯源追踪并保留记录,可以有效保护分发体系的长期有效运转。 2. 受众需求更加多样,信息传递更加清晰 从传播学理论来看,“媒介是人的延伸”,人是信息传播的重要媒介和载体,其自身的流动性致使信息无处不在。元宇宙概念所延伸出的是个人生活中的虚拟与现实边际逐渐被打破,人们一直对世界的把握有强烈冲动,追求认知上的确定性,需求将会不断增长。任何人都可以在元宇宙中感受实感的虚拟体验,同时自身的传播属性也随时有可能发生改变,由受众变成新一轮的传播者,甚至其他动物也能依靠不同的传播手段搭载信息片段,形成新的媒介平台,可以说,在多种技术手段加持下的新媒体可以赋予任意用户发布和传播任意信息的权利。时间和空间在极大程度上将不再成为任何人的桎梏,通过媒介可以在任意时间、地点发布和生产信息,同时也可以接收来自不同时间地域传播者的信息。此外,元宇宙下的融媒体发展将更新原有内容传播的路径,进一步推进媒体深度融合。融入元宇宙的融媒体将颠覆原有的媒介传播形态,无限增强人的多维度立体感受,弱化现实中时间与空间的概念,仿真性地将人带入虚拟世界之中。例如在当前媒体的新闻信息报道时,大众基本通过由现场记者产生的新闻稿和实地转播获得第一时间的信息,再根据自我思维对信息进行再加工处理。元宇宙下的融媒体则通过各类技术手段将用户直接带入信息产生场景,甚至通过多重加工创造全新的传播“现场”,实现线下场景元宇宙化。 1.6.6 WiFi 6和WiFi 7 WiFi联盟成立于1999年,最初名称叫作Wireless Ethernet Compatibillity Alliance(WECA)。在2002年10月,正式改名为WiFi Alliance,简称WiFi。 以前WiFi联盟用802.11a、802.11b、802.11g、802.11n等类似的名字来描述WiFi,大部分人根本弄不清楚这些名字的意义,经常弄混。现在WiFi联盟宣布改变 WiFi 标准的命名方式,分别将802.11n和802.11ac命名为WiFi 4和WiFi 5,将802.11ax命名WiFi 6,将802.11be命名WiFi 7。 1. WiFi 6 WiFi 6即第六代无线网络技术,是WiFi联盟创建于IEEE 802.11标准的无线局域网技术。WiFi 6允许与多达8个设备通信,最高速率可达9.6Gb/s。 WiFi 6主要使用OFDMA、MU-MIMO(多用户多入多出)等技术,MU-MIMO技术允许路由器同时与多个设备通信,而不是依次进行通信。MU-MIMO允许路由器一次与四个设备通信。 WiFi 6中的新技术允许设备规划与路由器的通信,减少了保持天线通电以传输和搜索信号所需的时间,可有效减少电池消耗并改善电池续航表现。 WiFi 6设备要获得认证,则必须使用WPA3,因此WiFi 6设备具有很强的安全性。 2. WiFi 7 随着4K和8K视频(传输速率可能会达到20Gb/s)技术、游戏(低时延)以及VR/AR的发展,融媒体也越来越依赖WiFi,并将其作为接入网络的主要手段之一,此外还对吞吐量和时延也提出了更高的要求,WiFi 6已无法完全满足需求,而WiFi 7的出现能有效解决这类问题。 WiFi 7是下一代WiFi标准,对应的IEEE 802.11将发布新的修订标准IEEE 802.11be。WiFi 7是在WiFi 6的基础上引入了320MHz带宽、4096-QAM、Multi-RU、多链路操作、增强MU-MIMO、多AP协作等技术,使得WiFi 7相较于WiFi 6将提供更高的数据传输速率和更低的时延。WiFi 7预计能够支持高达30Gb/s的实际吞吐量,大约是WiFi 6的三四倍。表1-3为几种WiFi 的主要技术参数对比。 表1-3 几种WiFi 的主要技术参数对比 比较项 WiFi 4 WiFi 5 WiFi 6 WiFi 6E WiFi 7 年份 2009 2013 2016 2019 2021 2024(完成) 协议 802.11n 802.11ac 802.11ax 802.11axe 802.11be Wave 1 Wave 2 工作频率 2.4/5GHz 5GHz 2.4/5GHz 6GHz 1~7.25GHz 最大频宽 40MHz 80MHz 160MHz 160MHz 320MHz MCS范围 0~7 0~9 0~11 最高调制 64QAM 256QAM 1024QAM 4096QAM 单流带宽 150Mb/s 433Mb/s 867Mb/s 1200Mb/s 2900Mb/s 理论带宽 600Mb/s 3.46Mb/s 6.94Mb/s 9.6Gb/s 46.4Gb/s 最大空间流 4×4 8×8 8×8 16×16 MU-MIMO / / 下行 上行/下行 上行/下行 OFDMA / / 上行/下行 上行/下行 安全机制 WPA2 WPA2 WPA3 WPA3 1.7 思考与练习 (1)什么是融媒体? (2)什么是全媒体? (3)简述融媒体的特征。 (4)什么是融媒体技术? (5)简述计算机的组成。 (6)简述互联网、因特网和万维网的区别和联系。 (7)因特网接入按传输介质可以分为几种? (8)TCP/IP协议可分为哪几层? (9)什么是云计算? (10)简述云计算的特点。 (11)云计算的核心技术有哪些? (12)简述云计算的核心技术。 (13)什么是大数据?大数据与大量的数据的区别是什么? (14)什么是大数据的4V特点? (15)什么是虚拟现实? (16)虚拟现实的关键技术是什么? (17)新兴融媒体技术都有哪些?它们在融媒体技术领域可能有哪些应用?