第5章 多媒体技术与应 用 随着计算能力的增加,以及网络基础设施的不断完善、网络带宽的不断增加和移动互 联网的迅速发展,基于语音、图像、视频等多种媒体集成的多媒体应用逐渐成为互联网应 用中不可或缺的重要内容,流媒体、移动多媒体、智能媒体以及虚拟现实等新兴多媒体技 术与传统多媒体技术的融合,为多媒体应用带来了更多的机遇。基于多媒体技术获取、传 输、存储、处理及发布信息已经成为常态,相应地,对多媒体的认识以及基于常用工具软件 进行图像处理、音频处理、动画制作、视频编辑等多媒体操作能力已经成为日常生活、学习 和工作中不可或缺的重要技能。 本章主要内容: .多媒体基础知识; .图像处理常用方法; .音频获取及音频编辑常用方法; .动画制作常用方法; .视频获取及视频剪辑常用方法 。 本章学习目标 : .了解多媒体的基本概念; .能够配置多媒体计算机; .能够使用Photoshop进行图像处理; .能够利用Audition进行音频的采集、剪辑和合成; .能够使用万彩动画大师设计并制作二维动画; .能够使用Premiere等软件进行视频剪辑。 5.多媒体技术概述 1 今天的互联网上,多媒体技术的应用几乎无处不在,从内容的表示及发布,到人与人 之间的交流互动,都能够看到多媒体应用的场景。基于多媒体技术对文字、图像、音频、视 频和动画等多种的媒体进行集成与处理,能够创造出更有表现力、更加赏心悦目,也更符 合人们需求的多媒体作品。 5.1 多媒体常用元素 1. 多媒体(multimedia)是多种媒体的处理、继承和利用的结果。多媒体技术是基于计 算机对文本、图形、图像、音频、视频、动画等多种媒体信息进行数字化采集、编码、存储、传 输、处理、解码和再现的技术,能够根据特定目标使多种媒体信息有机融合并建立逻辑连 接,使得用户可以通过眼睛、耳朵等感官与计算机进行交互。多媒体常用元素是指多媒体 应用中可呈现给用户的媒体形式,主要有文本、图形、图像、音频、动画、视频等,如 图5-1所示。 图5- 1 多媒体元素 1. 文本 文本包括字母、数字、汉字等,是计算机多媒体处理的基础。主流的多媒体应用软件 都包含文本编辑功能,例如Photoshop图像处理软件中可添加和编辑文字,并能设置文字 描边、投影等效果;Premiere具有添加字幕的功能等。 2. 图形、图像 图形是矢量图,一般指利用计算机绘制的直线、圆、曲线、图表等,文件较小,缩放无失 真,如图5-2所示。图像是位图,以像素为基本元素,是对物体形象的影像描述,表现自然 和细节景物层次、色彩较丰富,是客观物体的视觉再现,但图像放大到一定程度后看起来 会显得模糊,如图5-3所示。图形是人们根据客观事物制作生成的,它不是客观存在的; 图像是可以直接通过照相、扫描、摄影得到,也可以通过绘制得到。 图5- 2 图形图5- 3 位图图像及放大的效果 3. 音频 数字音频是相对于模拟音频而言的,通常所说的音频一般是指模拟音频,是指由物理 振动产生的声波,通过空气或液体、固体等介质传播并能被人或动物的听觉器官所感知的 波动现象。而现代计算机、MP3 、数码摄像机、数字电视等设备中的音频是使用数字的形 式存储的。数字音频主要有两种:用传声器等拾音设备录制的真实世界的声音、利用计 算机设备合成的语音和音乐等。 第 5 章多媒体技术与应用 129 4. 动画 动画是根据人眼的视觉暂留特性,一般用每秒15~30 帧的速度顺序地播放静止图 像,使之产生运动的感觉,从而形成连续的画面。根据画面的视觉效果,动画分为二维动 画和三维动画。 5. 视频 视频通常是通过实时摄取自然景象或者活动对象获得的影像,一般来自摄像机、摄像 头、手机等。常见的视频文件格式有mp4、avi、mov、flv、mpg 、dat、wmv 、3gp 、asf等。 (1)帧频。帧是视频的构成元素,每一幅静态图像被称为一帧。帧频指每秒录制或 播放的帧的数量,单位是帧/秒(p视频画面就越流畅,视频文件占用的空 fs)。帧频越高, 间就会越大。一般电影的帧频是24fps,电视是25fps或者30fps。 (2)视频分辨率。视频分辨率指每帧图像在水平和垂直方向的像素划分。视频分辨 率的大小决定了每一幅静态图像的质量和视频的尺寸大小。视频尺寸通常只用垂直方向 的像素数表示,一般有480P 、720P 、1080P 。 (3)码率。码率也称为视频比特率,指每秒传输视频信息的二进制位数,单位是比 特/秒(bps)。比特率越高,传送数据速度越快。码率一般有1500bps、3000bps。 (4)标清、高清和超高清。标清(StandardDefinition,SD)视频垂直分辨率一般为480P, 最高不超过576P 。高清(HighDefinition,HD)视频最低是720P,一般可达1080P 。超高清 (UHD)视频是高于高清电视标准的数字电影格式,如4K 格式的分辨率是1080P 的4倍,即 3840×2160=1920×2×1080×2 。目前,高端数字摄像机均支持4K 标准。 1.多媒体压缩技术 5.2 音频和视频文件都比较大,对传输速率、存储空间等有较大的需求。在实际处理过程 中,一般都需要通过数据压缩技术来减小文件的大小。 问题5- 1 如何让庞大的多媒体文件在网络上进行传输? 一幅分辨率为1920×1080 、色彩深度为24 位的静态图像需要5. 9MB 的存储 空间。高清视频每秒至少要播放25 帧图像才能形成连续而流畅的动态图像,数据量更加 庞大,存储与传输都不方便。为了使多媒体技术达到实用水平,除了采用新技术手段增加 存储空间和通信带宽外,对数据进行有效压缩是必须要解决的技术问题之一。 多媒体压缩技术是在无失真或者允许一定失真的情况下,通过编码技术以尽可能少 的数据表示各种多媒体对象,以方便存储与传输。通过压缩文件中的某些字节,可以减少 文件大小。例如,使用Phtsos8MB, oohp设计的一幅pd格式的图像的大小为11.将其转 换为jpg 格式后,大小只有71.如图54所示。 7KB, 压缩技术通常分为无损压缩和有损压缩两类 。 1. 无损压缩 无损压缩,也称为可逆压缩、无失真编码,是指压缩后的数据经解压后,能够恢复到与 原始数据完全相同,也就是在压缩过程中没有产生失真。一般用于文本数据、程序以及重 130 大学计算机———概念、思维与应用 图5- 4 文件压缩前后大小比较 要图片和图像的压缩,但不适合对图像、视频和音频数据的实时处理,其压缩比一般为 2∶1到5∶1 。目前常用的无损压缩软件有WinZip和WinRAR等。 2.有损压缩 有损压缩,也称为不可逆压缩,压缩时减少的数据信息是不能恢复的,因此有损压缩 能够获得较高的压缩比。有损压缩可以应用于图像、视频和音频文件,压缩比可达几十倍 甚至上百倍。JPEG和MPEG等文件使用的都是有损压缩,它利用了人的视觉系统特 性,去掉了视觉冗余信息和数据本身的冗余信息,依然能够保证较高的图片质量。大多数 有损压缩技术的压缩比可以设置,例如Photoshop中可以选择“高、中、低”等不同质量,质 量越低文件越小。 问题5- 2 面对纷繁复杂的多媒体文件,国际上是如何进行规范管理的? 有没有通 用的国际标准呢? 为了便于存储、处理与传送,多媒体文件要遵守一定的标准。常用的有国际 电信联盟(ITU)制定的H.263 、H.265等实时视频通信方面的标准,以及国 ISO) 261 、H.264 、H. 广播电视、 际标准化组织(制定的MPEG1 、MPEG2与MPEG4等视频储存、 如H. 计算机 网络上的流媒体方面的标准。随着技术的进步,两者的界线愈来愈模糊, 265为 ITU发布用于超高清视频UHD的标准。 常见的多媒体国际标准如下。 (1)JPEG标准。JPEG是数字图像压缩的国际标准,用于连续变化的静止图像,分 为有损压缩与无损压缩。JPEG对单色和彩色图像的压缩比通常分别为10∶1和15∶1 。 目前,许多浏览器都将JPEG作为标准的文件格式。 (2)MPEG标准。MPEG标准既适用于运动图像,也适用于音频信息。MPEG先后 推出了MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-215个版本,最早发表的 MPEG-1主要用于音频,最为用户熟知的是MPEG-1Layer3(简称为MP3 )。MPEG-2 是第二代规格,是DVD的核心技术。MPEG-4是第三代规格,主要用于视频电话与电视 传播,是目前最为流行的视频格式。MPEG-7主要应用于数字图书馆、多媒体目录服务 等。MPEG-21标准的正式名称为“多媒体框架”或者“数字视听框架”,它致力于为多媒体 传输和使用定义一个标准化的、可互操作的和高度自动化的开放框架。 (3)H.265标准是国际电信联盟(推出的高效视频编码(i 265标准。H.ITU) hgh efiincyvdeocdn)。H.264标准有较大的改善, ceioig 265较之前H.该标准旨在有限带宽 第 5 章多媒体技术与应用 131 下传输更高质量的网络视频,仅需原先的一半带宽即可播放相同质量的视频。这也意味 着,智能手机、265 标 平板电脑等移动设备将能够直接在线播放1080p的全高清视频。H. 准同时支持4K 和8K 超高清视频 。 5.3 多媒体系统组成 1. 多媒体系统是拥有多媒体功能的计算机系统,由多媒体硬件系统和多媒体软件系统 两部分组成。 1. 多媒体硬件系统 多媒体硬件系统既包含传统的计算机硬件设备,如CPU 、主板、内存、硬盘驱动器、显 示器及打印机等,也包含专用的多媒体信息处理设备,如多媒体接口卡、音视频输入输出 设备等。 (1)多媒体接口卡。多媒体接口卡插接在计算机主板扩展槽中,以解决各种媒体数 据的输入输出问题。常用的多媒体接口卡有显卡、声卡、视频卡等,如图5-5所示。目前, 日常家用和办公的计算机硬件均具备多媒体接口卡。 图5- 5 多媒体接口卡 ①显卡。显卡工作在CPU 与显示器之间,主要控制视频信号的输出。显卡分为独 立显卡和集成显卡。独立显卡的功能比集成显卡强,能够流畅地显示复杂的三维场景。 ②声卡。声卡用于处理音频信息,完成音频信号的A/D(Analog/Digital,数模)和 D/A(Digital/Analog,模数)转换以及数字音频的压缩、解压缩与播放等功能。声卡提供 与其他音响设备的接口,如传声器、耳机、外接音箱以及MIDI 设备等。声卡分为外置声 卡和集成声卡。外置声卡是一块独立的可插拔的板卡,比集成声卡效果好。 ③视频卡。视频卡主要用于视频信号的A/D和D/A转换以及数字视频的压缩和 解压缩,提供与摄像头、数码摄像机等信号源连接的接口。 (2)多媒体外围设备。多媒体外围设备有多媒体输入设备和多媒体输出设备。常用 132 大学计算机———概念、思维与应用 的多媒体输入设备有扫描仪、手写板、数码相机、触摸屏以及数字笔等;输出设备既有传统 的打印机及显示器,也有专用的音箱、绘图仪、3D打印机等。 2.多媒体软件系统 多媒体软件系统分为系统软件及应用软件两类。多媒体系统软件是多媒体系统的核 心,具有管理各种媒体及设备并使其协调工作的功能,通常指多媒体操作系统。 Windows、iOS等操作系统都是多媒体系统软件。多媒体应用软件包括多媒体创作软件、 多媒体教学软件、游戏软件等。 (1)多媒体创作软件。根据处理的多媒体对象不同,可将多媒体创作软件进行分类, 如表5-1所示。 表5- 1 常用多媒体创作软件 处理对象类型软件名称主要功能 图形AutoCAD 二维及三维绘图设计 CorelDRAW、Ilustrate 矢量图形制作 图像Photoshop、光影魔术手、美图秀秀图像处理 二维动画万彩动画大师、HTML5 二维动画制作 三维动画3dsMAX、Maya 三维动画和建模 音频Audition 数字音频处理 视频Premiere、CamtasiaStudio、会声会影、AfterEfects 视频采集、剪辑、特效、合成 (2)格式转换软件。格式转换软件能把不同类型的音视频格式转换成指定的格式, 方便对其进行再编辑。例如,格式工厂是一款国产的多媒体格式转换软件,能够将视频转 换为MP4 、AVI 、FLV 、MOV等格式,将音频转换为MP3 、WMA 、OGG 、WAV等格式,操 作方法如图5-6所示。 (3)多媒体播放器。常见的多媒体播放器有WindowsMediaPlayer、QuickTime 、 KMPlayer、搜狐影音、PPS影音、爱奇艺、优酷等。其中,苹果计算机自带的QuickTime 可播放MOV 、MPEG和MP4等格式的视频,并具有录屏功能。 1.多媒体技术的应用领域 5.4 多媒体技术具有多样性、集成性、交互性、实时性和易扩展性等特点,已经覆盖了生活 与工作的各个领域。 1.教育培训 多媒体技术可以用于数字学习(如MOOC自主学习)、扫码观看短视频的立体化教 材、实时交互远程教学;也可以用于虚拟仿真实验、教育App等。 2.新闻出版 电子出版物具有体积小、成本低、检索快等特点,易于保存和复制,能存储图、文、声、 第 5 章多媒体技术与应用 133 图5- 6 转换多媒体格式 像等信息,常见的有电子图书、期刊、广告等。 3. 新兴通信交流媒介 多媒体技术与计算机技术及通信技术的结合改变了传统通信方式,可视电话、视频会 议已经成为当今主要的通信与交流手段,远程医疗则是更高层次的应用。 4. 商业与咨询 多媒体技术广泛应用于商业与咨询活动中,例如商业简报、商业数据分析与可视化、 产品演示、电子商务等。利用多媒体技术可以为公众提供各种咨询服务,如旅游、邮电、交 通、金融、服务行业等。 5. 其他 多媒体技术还广泛应用于影视广告、艺术设计、室内设计、文物保护和展示、科学研究 等。在北京奥运会开幕式上,运用多媒体技术制作了巨幅“卷轴”画册,如图5-7所示。新 的全息投影技术将虚拟现实、网络等多种技术结合在一起,有了更加广泛的应用,例如,用 图5- 7 巨幅“卷轴”画册 134 大学计算机———概念、思维与应用 于文物展示和保护的数字敦煌、数字故宫等,如图5-8所示。 图5- 8 故宫文物“冰戏图”以全息投影方式展出 .................................................................................. 查阅资料,说一说多媒体技术在本专业中有哪些具体应用。多媒体技术的 发展会如何影响人类的生活? .................................................................................. 5.数字图像处理技术 2 图像是人类最容易接收的信息,是多媒体的重要元素。人类有70%~80%的信息获 取是通过视觉系统所形成的图像。数字图像处理是生活中最常用的计算机操作技能。 2.图像处理基础 5.1 图像给人更多的真实感,色彩与图像质量在其中扮演重要角色。图形尺寸、分辨率和 颜色深度是体现图像质量的主要指标。常见的图像文件格式有bmp、jpg 、gif、png、tif 、 psd等。 1.尺寸、色彩和分辨率 图像尺寸是指图像的长度和宽度,通常以像素(Pixel)为单位,也可以是厘米、英寸 等。一个像素点由红色(R)、绿色(G)和蓝色(B)3种颜色组成,称为RGB色彩,这种表示 颜色的方式称为RGB模式,应用最为广泛。而在印刷制品领域,为确保可以产生有光泽 的纯黑色,则使用CMYK颜色模式,C是青色、M是洋红色、Y是黄色、K是黑色,如 图5-9所示。 (1)图像色彩深度。图像色彩深度指图像中表达每个像素所需要的二进制位数。如 果图像色彩深度为1,表示每个像素只有一个颜色位,通常为黑白图;如果深度为24位, 则表示每个像素有24个颜色位,又称为真彩图像。 (2)分辨率。分辨率是指图像在水平方向和垂直方向上包含的像素数量。一般来 说,分辨率越高,图像就越清晰,图像文件越大。 第 5 章多媒体技术与应用 135 图5- 9 RGB 和CMYK 2. 常用图像处理软件 常用图像处理软件有Photoshop、光影魔术手、美图秀秀等。Photoshop是由Adobe 公司出品的专业图像处理软件,具有图像编辑、图像合成、校色调色及特效制作等各种复 杂功能,应用广泛。光影魔术手和美图秀秀操作简单,能快速实现色彩调整、证件照设计、 加边框、拼图、添加水印和批处理图片等常见操作,缺点是不适合复杂的操作。 例5- 1 Photoshop图片合成示例———阳光宝宝。 启动Photoshop,打开两张素材图片。先将宝宝图片中的宝宝头部作为选区,设定羽 化值后抠取出来,再将选中的部分拖至向日葵图片中,最后写入“阳光宝宝”4个字,最终 “宝宝头部”“向日葵”“文字”3个图层叠加后的效果如图5-10 所示。 图5-10Photoshop图像处理 在【例5-1】中,涉及选区、羽化、图层等图像处理的常用术语,其含义如下。 (1)选区。通过工具或相应命令在图像上创建的选取范围。选区创建后,可对选区 进行编辑,注意,创建选区后,任何编辑对选区外都无效。 (2)羽化。羽化是使选区边缘虚化,起到渐变的作用,达到选区内外自然衔接的 效果。 (3)图层。图层可以看作透明的电子画布,每一层都存储不同的图像。多个图层一 层一层上下叠加,从而构成一幅完整的图像。Photoshop中用灰白相间的方格表示透明 136 大学计算机———概念、思维与应用 区域。此 外,常用术语还有如下几个。 (1)容差。容差是指色彩的容纳范围。容差数值越大,每次单击选择的颜色色差范 围越大。 (2)流量。流量用于控制画笔作用时的颜色浓度。流量越大,颜色浓度越深。 (3)蒙版。蒙版是模仿传统印刷中的一种工艺而来,印刷时会用一种红色的胶状物 来保护印版。在Photoshop中,蒙版默认的颜色是红色。蒙版将不同的灰度色值转换为 不同的透明度,黑色完全透明,白色为完全不透明。 (4)滤镜。滤镜是Photoshop中的插件模块,以达到对图像进行抽象、艺术的特殊处 理效果。 2.图像选取和裁剪 5.2 在图像处理中,无论是简单的图像缩放、裁剪、合成或者进行色彩调整、特效修饰,首 先都必须“选取”要处理的图像区域。 1. 创建选区 在Photoshop中,创建选区可以实现局部图像处理,选区外的图像不能编辑。选区的 边界以跳动的蚂蚁线来标识。按Ctrl+D 快捷键可以取消选区。 (1)创建选区。针对边界轮廓规则的图像元素,使用圆形、椭圆形等创建选区;如果 是不规则图形,但轮廓清晰,可以使用“磁性套索工具”;如果轮廓为多边形,则选择“多边 形套索”;其他情况选择“套索工具”;如果背景单一,使用“魔棒工具”,如图5-11 所示。 图5-11 创建选区的工具 (2)羽化选区。为了使选取后的图片边缘达到自然过渡的半透明效果,一般先设置 羽化值,再创建选区。羽化半径越大,边缘轮廓越虚化,如图5-12 所示。 图5-12 设置羽化 第 5 章多媒体技术与应用 137