第5章chapter5

视频获取与处理本章学习目标: 
 了解: 数字视频的基本概念
 理解: 数字化视频的过程
 掌握: 数字视频的相关参数: 制式、扫描、分辨率、宽高比等
 掌握: 数字视频的文件格式
 了解: 数字视频的制作及处理工具
 掌握: 数字视频的制作与处理的基本方法
5.1视频的基础知识〖*4/5〗5.1.1视频的基本概念视频(video)是连续变化的影像,是目前多媒体技术中比较复杂的处理对象。视频通常是指实际场景的动态演示,比如电影、电视和摄像资料等。
5.1.2数字视频的基本概念
总体来说,数字视觉媒体可以分为静态和动态两大类,具体可以用图51表示。在前面的章节中,第三章讲解了静态视觉媒体的获取与处理,第四章讲解了动态视觉媒体中动画设计与制作的相关内容。
图51数字视觉媒体的分类
动画和视频信息是连续渐变的静态图像或图形序列,沿时间轴顺次更换显示,从而构成动态视觉的媒体,如图52所示。当序列中每帧图像是由人工或计算机产生的图像时,称为动画。当序列中每帧图像是通过实时摄取自然景象或活动对象获得的图像时,称为视频,当把这些视频放入计算机中形成数字文件,即为数字化视频。数字视频的内容是被计算机捕捉并数字化了的影音信息,可以将图像和音频的信号结合在一起存放。
◆多媒体技术与应用第◆5章视频获取与处理图52动态视觉媒体
5.1.3模拟视频与数字视频的区别
模拟视频是指由连续的模拟信号组成的视频图像,过去的电影、电视都是模拟信号,之所以将它们称为模拟信号,是因为它们模拟表示了声音、图像信息的物理量。摄像机是获取视频信号的来源,早期的摄像机以电子管作为光电转换器件,把外界的光信号转换为电信号。摄像机前被拍摄物体的不同亮度对应不同的亮度值,摄像机电子管中的电流会发生相应的变化。模拟信号就是利用这种电流的变化来表示或者模拟所拍摄的图像,记录下它们的光学特征,然后通过调制和解调,将信号传输给接收机,通过电子枪显示在荧光屏上,还原成原来的光学图像。这就是模拟视频获取和播放的基本原理。
数字视频就是以数字形式记录的视频。数字视频可以有多种产生的方式,比如通过数字摄像机直接产生数字视频信号,存储在磁盘、光盘或者P2卡等存储介质上,从而得到不同格式的数字视频,然后通过计算机或特定的播放器播放出来。
随着数字视频应用范围的不断发展,它的功效越来越明显。数字视频与模拟视频相比有以下特点: 
(1) 数字视频可以无失真地进行无限次复制,而模拟视频信号每转录一次,就会有一次失真。
(2) 数字视频可以长时间地存放而不会降低视频原质量,而模拟视频长时间存放后,视频质量会降低。
(3) 可以对数字视频进行非线性编辑,并可以增加特效,而模拟视频不能进行非线性编辑。
(4) 数字视频数据量大,在存储与传输过程中必须进行压缩编辑。
5.2数字化视频〖*4/5〗5.2.1数字化视频的过程一般来说,获得数字视频主要有以下两种方法: 
(1) 通过数字摄像机直接产生数字视频信号,存储在磁盘、光盘或P2卡等存储介质上,然后放入计算机中。
(2) 通过视频采集卡获取。这类采集卡用以将摄像机、录像机、电视机等输出的模拟信号从模拟输入接口输入,数字化后存入计算机。
其中,将模拟视频信号数字化并转换为计算机数字视频信号的多媒体卡称为视频捕捉卡或视频采集卡。模拟视频数字化需要经过一系列的技术处理: 包括颜色空间的转换、扫描方式的转换、分辨率的转换等过程。将模拟电视数字化的基本方法是: 采用一个高速的模/数转换器对全彩色电视信号进行数字化,然后在数字域中分离亮度和色度,最后再转换成RGB分量。
5.2.2数字视频的数据量计算
数字视频信号既有空间维度,又有时间维度。对于一幅未经压缩的数字图像来说,它的计算公式是: 数字图像数据量=分辨率×位深度/8(B)。因此,对于一个未经压缩的数字视频来说,它的图像部分的数据量计算方法如下: 
数字视频数据量=分辨率×位深度×帧频×时间/8 (B)
下面举例说明数字视频图像数据量的计算过程。
问题描述: 一个2分钟时长、帧频为24,分辨率为720像素×576像素,24位真彩色的数字视频,不经压缩的数据量是多少?具体的计算过程如下: 数字视频数据量=分辨率×位深度×帧频×时间/8B
数字视频数据量=720×576×24×24×120/8B
≈3 583 180 800B 
≈3 499 200KB 
≈3417MB
≈3GB 由此计算可知,如果不对数字视频进行压缩,仅视觉信息部分的数据量就非常庞大。数字视频中还同时存储了声音信息,因此,非常有必要对数字视频的影像和声音信息进行压缩编码。
当然,数字视频数据之所以能够被压缩,主要是其中存在大量的冗余数据,包括时间冗余、空间冗余、结构冗余、视觉冗余、知识冗余和数据冗余等。在保证视频质量相同的前提下,谁挖掘利用的冗余越多,谁的数据速率就越低,压缩率就越高。
5.2.3数字视频的相关参数〖*2〗1. 制式实现电视的特定方式,称为电视的制式。制式定义了对视频信号的解码方式。
不同制式对色彩的处理方式、屏幕扫描频率等有不同的规定。因此,如果计算机系统处理视频信号的制式与其相连的视频设备的制式不同,则会明显降低视频图像的效果,有的甚至根本没有图像。
在黑白和彩色模拟电视的发展过程中,分别出现过许多种不同的制式。各国的模拟电视制式不尽相同,制式的区分主要在于帧频、分辨率、信号带宽以及色彩空间的转换关系不同等。在国际上,模拟电视视频制式标准有三种: NTSC制式、PAL制式、SECAM制式。三种制式的具体的区别如表51所示。由于数字电视是从模拟电视发展而来,这三种模拟彩色电视制式互不兼容,因此数字电视的格式明显带有各种彩色电视制式的痕迹。而数字电视格式的标准目前并未统一。表51三种模拟电视视频制式
TV制式NTSC
正交平衡调幅制
NTSC(National Television 
Systems Committee,
国家电视制式委员会)PAL
逐行倒相正交平衡调制
PAL(PhaseAlternative
 Line)SECAM
顺序传送彩色与存储制 
SECAM(Sequential 
Couleur à Mémorire(法文))代表国家美国、加拿大、日本中国、德国、英国法国、俄罗斯分辨率720×480720×576720×576画面宽高比4∶34∶34∶3帧频3025252.  扫描
传送数字图像时,将每幅图像分解成很多像素、按一个一个像素、一行一行的方式顺序传送或接收,就称为扫描。
i和p分别表示两种不同的扫描方式,i为隔行扫描(interlace scan),p为逐行扫描(progressive scan)。
隔行扫描是将一帧图像分成两场(从上至下为一场)进行扫描,第一场先扫描1、3、5等奇数行,第二场再扫描2、4、6等偶数行,普通的电视机一般都采用隔行扫描。逐行扫描是将各扫描行按照次序扫描,即一行紧跟一行的扫描方式,计算机显示器都采用逐行扫描。两种扫描方式示意图如图53所示。
随着数字电视技术的发展,隔行扫描方式会逐渐被逐行扫描方式取代。
图53两种扫描方式示意图
3. 分辨率
Digital Television,即数字电视,其采集、制作、节目的传输都采用数字信号。数字视频的分辨率也就是清晰度,包括垂直和水平两个方向。在相同尺寸范围内,水平和垂直方向上能够分辨出的点数越多,图像就越清晰。所谓高清晰度电视(high definition television),指的是图像质量等于或者超过35mm胶片电影质量的电视,它传送的视频信号量为普通电视的4~5倍。国际电联给出的定义是: 一个正常视力的观众在距该系统显示屏高度的3倍距离上所看到的图像质量应具有观看原始景物或表演时所得到的印象。
目前,虽然世界上的数字电视格式繁多,没有统一的格式,但根据数字视频的不同分辨率水平,大致可以分成以下几种类型。 
 LDTV(lowdefinition television): 低清晰度电视,简称低清电视。
 SDTV(standard definition television): 标准清晰度电视,简称标清电视。
 HDTV(high definition television): 高清晰度电视,简称高清电视。
 UHDTV(ultra high definition television): 超高清晰度电视,简称超高清电视。
目前,常见的数字电视广播制式共有5种。其中,标准清晰度电视广播有480i和480p两种,高清晰度电视广播有720i、720p、1080i、1080p。
其中,数字反映的是视频的垂直分辨率。例如,720p就是指1280×720逐行扫描,这是一种将信号源的水平分辨率按照约定俗成的方法进行缩略的命名规则。达到720p以上的分辨率是高清信号的准入门槛,因此720p标准也被称为HD标准,而1080i/1080p被称为全高清(Full HD)标准。
生活中常见的2K(1920×1080)、4K(3840×2160)、8K(7680×4320)的表达,也是视频分辨率的一种简要描述方式。例如,4K即分辨率为3840×2160的数字电视。
4. 宽高比
视频画面的宽高比是指视频图像的宽度和高度之比。而像素长宽比是指图像中每一个像素的长度和宽度之比。画面的长度=横向像素数×每个像素的长度,画面的宽度=纵向像素数×每个像素的宽度。在许多情况下,像素点不一定是正方形的。如图54所示,两幅画面的宽高比相同,但像素的长宽比却不同。
图54画面宽高比与像素长宽比的示意图
通常,电视像素是矩形,计算机显示器像素是正方形。因此,在计算机显示器上看起来合适的图像,在电视屏幕上会变形。
选择像素长宽比取决于数字视频将在什么样的终端显示,如果仅仅是在计算机显示器上显示,就选择方形像素,如果要在电视或宽屏电视上显示,则要选择相应的像素长宽比,以免发生变形。例如,如图55所示,在Adobe Premiere CC 2017中进行序列设置时,就有帧大小(水平像素数、垂直像素数、帧宽高比),像素长宽比的选项,应根据实际需要选择。
图55软件中的帧大小与像素长宽比设置
5.2.4数字视频的文件格式
细分起来,广义的视频文件可以分为两类: 即动画文件和影像文件。
动画文件指由相互关联的若干帧静止图像所组成的图像序列,这些静止图像连续播放便形成一组动画,通常用来完成简单的动态过程演示。
影像文件主要指那些包含了实时的音频、视频信息的多媒体文件,其多媒体信息通常来源于视频输入设置。下面介绍一些主流的视频文件格式。
1. AVI
AVI是音频视频交错(Audio Video Interleaved)的英文缩写,它是微软公司开发的一种符合RIFF文件规范的数字音频与视频文件格式,原先用于Microsoft Video for Windows环境,现在已被Windows、OS/2等多数操作系统直接支持。
AVI格式允许视频和音频交错在一起同步播放,支持256色和RLE压缩,但AVI文件并未限定压缩标准。因此,AVI文件格式只是作为控制界面上的标准,不具有兼容性。用不同压缩算法生成的AVI文件,必须使用相应的解压缩算法才能播放出来。
2. Windows Media
Windows Media视频文件主要有两种不同的扩展名: ASF文件和WMV文件。
ASF是Advanced Streaming Format的缩写,是微软公司Windows Media的核心。ASF定义为同步媒体的统一容器文件格式。ASF是一种数据格式,包括音频、视频、图像以及控制命令脚本等多媒体信息。这种格式以网络数据包的形式传输,实现流式多媒体内容发布。
WMV是微软推出的一种流媒体格式,它由ASF格式升级延伸而来。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。
3. MPEG文件(MPG/DAT)
MPEG的英文全称为Moving Picture Expert Group,即运动图像专家组格式,VCD、SVCD、DVD视频就是这种格式。MPEG是压缩视频的基本格式。MPEG有两个变种: MPV和MPA。MPV只有视频不含音频,MPA则是只记录了音频没有视频。
VCD中的DAT文件,实际上是在MPEG文件头部加上了一些运行参数形成的变体。可以使用软件将其转换成标准的MPEG文件。
目前,MPEG视频格式标准包括MPEG1 Video、MPEG2 Video、MPEG4 Video,H.264/MPEG4 AVC、H.265/MPEGH HEVC。这些视频标准有许多共同之处,且基本概念类似,数据压缩和编码方法基本相同,它们的核心技术都是采用以图像块作为基本单元的变换、量化、移动补偿、熵编码等技术,在保证图像质量的前提下获得尽可能高的压缩比。
4. Real Media
RM、RMVB都是Real Networks公司制定的音频视频压缩规范,根据不同的网络传输速率而制定出不同的压缩比率,从而在低速率的网络上进行影像数据实时传送和播放,具有体积小、画质较好的优点。
RMVB改变了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上采用浮动比特率编码的方式,将较高的比特率用于复杂的动态画面,而在静态画面中则灵活地转为较低的采样率,从而使RMVB最大限度地压缩了影片的大小,并拥有接近DVD品质的视听效果。一般来说,一部120分钟的DVD体积为4GB,而使用RMVB格式来压缩仅有400MB左右,而且清晰度不会差太远。RMVB格式兴盛一时,但目前已被MP4、MKV等格式所替代。
5. MOV
MOV即QuickTime影片格式,是苹果公司开发的一种音频、视频文件格式,用于保存音频和视频信息,具有先进的视频和音频功能。当选择QuickTime(*.mov)作为保存类型时,将保存为.mov文件。MOV格式被众多的多媒体编辑及视频处理软件所支持,具有较高的压缩率和较完美的视频清晰度,并具有较好的跨平台性。
6. 3GP
3GP主要是为配合3G移动通信网的高传输速度而开发的视频编码格式,也是手机中常用的一种视频文件格式。它是MP4格式的一种简化版本,是3G移动设备标准格式,应用在手机、MP4播放器等便携式设备上,其优点是文件体积小,移动性强,适合移动设备使用。缺点是在PC上兼容性差,分辨率低,帧数低。
7. FLV
FLV是 Flash Video 的简称。它的出现有效解决了视频文件导入Flash后使导出的SWF文件体积庞大,不能在网络上很好使用等问题。 FLV压缩与转换非常方便,适合制作短片。一般FLV 包在 SWF Player的壳里,并且 FLV 可以很好地保护原始地址,不容易下载到,起到保护版权的目的,许多视频分享网站都采用FLV格式。 
5.3数字视频的制作与处理〖*4/5〗5.3.1线性编辑传统的视频编辑采用线性编辑方式。线性编辑系统由一台放像机、一台录像机和编辑控制器组成,也可以由多台录、放像机加特技设备组成复杂系统。通过放像机选择一段合适的素材,然后把它记录到录像机中的磁带上,再寻找下一个镜头,然后再记录,如此反复,直到把所有的素材都按顺序剪辑记录下来。通常完成一个视频的剪辑要反复更换录像带,寻找需要的部分,整个制作过程非常烦琐,而且经过多次的重复编辑还会降低视频质量。
传统的线性编辑,编辑时必须顺序寻找所需要的视频画面。用传统的线性编辑方法,插入与原画面时间不等的画面,或删除节目中某些片段时都要重编;而且每编辑一次视频质量都有所下降。
5.3.2非线性编辑
非线性编辑简称非编。非线性编辑系统实际上是扩展的计算机系统,由一台高性能计算机和一套视频、音频输入/输出卡(即非线性编辑卡),配上一个大容量SCSI磁盘阵列,便构成了一个非线性编辑系统的基本硬件。非线性编辑系统直接从计算机的硬盘中以帧或文件的方式存取素材,进行编辑。
它是以计算机为平台的专用设备,可以实现多种传统视频制作设备的功能,可以随意地改变素材顺序,随意地缩短或加长某一段,添加各种效果等。数字化的存储方式则使文件剪辑、复制等操作不再出现损耗。使用非线性编辑系统,可以尽情发挥想象力,不再受线性编辑系统的束缚。 
非线性编辑的应用领域很广,随着计算机技术的飞速发展,非线性编辑技术也在不断地更新和进步。它对传统的影视广告制作业产生了极大影响,从商业简报、教学资料片、多媒体读物、产品演示宣传、企业专题片、网页动画到大型的电影和电视剧,都有非线性编辑的应用。
相对于传统线性编辑而言,非线性编辑具有信号质量高、制作水平高、设备寿命长、软件升级便利和网络化的优势,弥补了线性编辑的短板。在现阶段的影视后期制作中,非线性编辑已经完全取代了线性编辑。
5.3.3常用视频制作与处理软件
数字视频制作与处理软件是将图片、音乐、视频等素材经过非线性编辑后,通过二次编码,生成数字视频文件的工具软件。
这类软件其实是对图片、视频、音频等素材进行重组编码工作的多媒体软件。重组编码是将图片、视频、音频等素材进行非线性编辑后,根据视频编码规范进行重新编码,转换成新的格式。这样,图片、视频、音频无法被重新提取出来,因为已经转化为新的视频格式,发生质的变化。不同的数字视频制作与处理软件具有不同的编辑与处理功能,提供不同的特效库及视频切换效果库,具有不同的编码运算及扩展能力。
1. Adobe Premiere
Adobe Premiere是由Adobe公司推出的一款视频编辑软件,现在常用的版本有CS4、CS5、CS6、CC 2014、CC 2015、CC 2017、CC 2018以及CC 2019版本。Adobe Premiere提供了采集、剪辑、调色、美化音频、字幕添加、输出、DVD刻录等一整套流程,有较好的兼容性,可以与Adobe公司推出的其他软件相互协作,目前广泛应用于电视台、广告公司以及电影剪辑等领域。本课程以Premiere软件为依托,讲解基本的视频制作与处理实验。
Adobe Premiere与Adobe公司的另一款后期特效制作软件After Effects都可以完成视频编辑和处理功能,不同之处在于,Premiere主要完成影片的剪辑工作,而After Effects则侧重为视频片段增加各种华丽特效。
本节所有视频制作与处理实验,都在Adobe CC 2017版本中进行演示。Adobe Premiere Pro CC 2017的启动窗口如图56所示。
图56Adobe Premiere Pro CC 2017的启动窗口