第3章chapter3 图像获取与处理本章学习目标: 掌握: 数字化图像的基本概念 理解: 图像数字化的基本过程 了解: 主流数字图像文件的格式 掌握: 数字图像信号的分类,矢量图形与位图图像的比较 理解: 三基色原理 了解: 颜色空间及其适用的场合 掌握: 数字图像的获取与处理方法 3.1图像的基础知识〖*4/5〗3.1.1图像的基本概念图像是自然界中多姿多彩的景物和生物通过视觉感官在人的大脑中留下的印记。在人类的发展史上,绘画、雕刻、摄影等艺术形式都是希望能够把这种大脑中的印记保留下来。如果把这印记放到计算机中,就是数字化图像。 ◆多媒体技术与应用第◆3章图像获取与处理人们常说: 百闻不如一见。图像是生活中最常用的一种媒体。将图像获取到计算机中,就可以对其进行数字化处理,满足不同的需求。 3.1.2图像的数字化 如同声音信号是基于时间和幅度的连续函数,在现实空间中,平面图像的灰度和颜色等信号都是基于二维空间的连续函数。计算机无法接收和处理这种空间分布、灰度、颜色取值均连续分布的图像。 图像的数字化,就是按照一定的空间间隔,自左到右、自上而下提取画面信息,并按照一定的精度对样本的亮度和颜色进行量化的过程。通过数字化,把视觉感官看到的图像转变成计算机所能接受的、由许多二进制数0和1组成的数字图像文件。 对图31所示的图像,按照一定的空间间隔,自左向右分割为10列,自上向下分割为8行,共计10像素×8像素,即80个小方格,如图32所示。 图31原图 图32分辨率10像素×8像素的图像效果 将每一个小方格称为一个像素(pixel)。画面分割的列数称为宽度像素数;画面分割的行数称为高度像素数。宽度像素数和高度像素数是数字化图像的基本属性。“宽度像素数×高度像素数”称为数字化图像的“分辨率”。 如果用一定位数的二进制信息将每一个小方格的颜色、亮度等信息记录下来,形成一个完整的文件保存在计算机中,这个文件就是一个数字化图像文件。 当然,在提取原图信息时,将画面分割为10像素×8像素,如图32所示,画质非常模糊。如果将画面分割为100像素×80像素,则获取的图像如图33所示,已经能够分辨出基本图像内容。如果将画面分割为1000像素×800像素,就已经基本能够接近原始画质了。 图33分辨率为100像素×80像素的图像效果 3.1.3图像数字化的基本过程 简单来说,图像数字化需要经过采样、量化和编码三个步骤,基本过程如图34所示。 图34图像数字化的基本过程 采样: 是对图像函数f(x,y)的空间坐标进行离散化处理。分辨率=宽度像素数×高度像素数。例如,图34的数字化图像分辨率为691像素×563像素。 量化: 对每一个离散的图像样本(即像素)的亮度或颜色样本进行数字化处理,每一个像素被数字化为几位0或1的二进制信息,称为位深度。如果位深度为1,则每个像素仅有0或1共2个级别;如果位深度为8,则每个像素可以量化为8位二进制,即可以有00000000~11111111共256个级别;如果位深度为24,则每个像素可以量化为24位二进制,共224个级别,约1600万个级别。例如,图34的数字化图像位深度为24,即每一个像素被数字化为24位二进制信息。 编码: 采用一定的格式来记录数字数据,并采用一定的算法来压缩数字数据,以减少存储空间和提高传输效率,不同的编码算法对应不同的图像文件扩展名。例如,图34的数字化图像使用了JPEG压缩算法,使数据量大幅度减少,形成了jpg格式的文件。 在数字化图像的过程中,需要解决三个问题,也就是要确定三个基本的数字化参数。 第一,分辨率: 一幅图像采集多少个图像样本,即记录多少个像素。 第二,位深度: 每个像素的亮度与颜色信息应该用几位二进制数来存储。 第三,格式: 采用什么格式记录数字数据,以及采用什么算法压缩数字数据。 基于以上三个参数,计算机硬件系统及软件系统共同支持数字化图像过程的完成。 3.1.4数据量与图像质量的关系 图像在数字化过程中的参数不同,形成的数字化图像的数据量也不同。未经压缩的数字化图像的数据量计算公式如下所示: 数字化图像数据量=分辨率×位深度/8 (B) 例如: 一幅分辨率为640像素×480像素、位深度为24的图像,计算其文件的大小如下所示: 640×480×24/8=921 600B≈900KB 通过计算公式可以看出,图像分辨率越高、位深度越大,数字化后的图像效果就越逼真,但图像数据量也越大。图像的分辨率、位深度和数据量对比如表31所示。表31分辨率、位深度与数据量的关系 分辨率/像素位深度/b数据量640×4808300KB16600KB24900KB800×6008469KB16938KB241.4MB1024×7688768KB161.5MB242.3MB3.1.5数字图像的文件格式 数据图像文件有很多种不同类型的格式,主要是在文件编码的过程中定义了不同的编码信息和压缩方法。 1. BMP BMP全称为Bitmap,是Windows操作系统中的标准图像文件格式。最典型的应用BMP格式的程序就是Windows的画笔。采用该格式的文件不压缩,占用的磁盘空间较大,图像深度只有1位、4位、8位及24位。BMP文件格式是当今应用比较广泛的一种格式,但缺点是文件比较大,所以只能应用在单机上,不适合在网络上应用。 2. GIF 图形交换格式(Graphic Interchange Format,GIF)的图像深度从1位到8位,即GIF最多支持256种颜色的图像,不适于表现真彩色照片或具有渐变色的图片。当把包含多于 256 色的图片压缩成 GIF 格式时,肯定会丢失某些图像细节。在网页制作中,GIF 格式的图片往往用于制作标题文字、按钮、小图标等。 GIF文件内部分成许多存储块,用来存储多幅图像或是决定图像表现行为的控制块,实现动画和交互式应用。GIF文件的数据是经过压缩的,该图像格式在网上广泛应用,其主要原因是256种颜色能满足主页图像的基本需要,而且文件较小。 3. JPEG 联合图片专家组格式(Joint Photographics Expert Group,JPEG)是另外一种在网上应用最广泛的图像格式。由于它支持的颜色数多,因此适用于使用真彩色或平滑过渡色的照片和图片。该图像格式是采用JPEG压缩技术压缩生成的,可以使用不同的压缩比例压缩文件,其压缩技术十分先进,对图像质量影响不大。因此,可以用最少的磁盘空间得到较好的图像质量,是网络上主流的图像格式。 4. PNG 可移植的网络图片格式(Portable Networks Graphics,PNG)用无损压缩来减小图片文件的大小,同时保留图片中的透明区域。此外,该格式是仅有的几种支持透明度概念的图片格式之一(透明 GIF 的透明度只能是 100%,但 PNG格式的透明度可以是 0~100%)。它比 GIF 和 JPEG 格式的压缩率要小一些,也就是说,PNG格式的文件往往要大一些。不过,随着网络带宽的不断加大,该格式将逐步普及,毕竟它具有更强大的表现能力。 5. PSD PSD图像格式是Adobe公司开发的图像处理软件Photoshop自建的标准文件格式。在该软件所支持的各种格式中,PSD格式存取速度比其他格式快得多,功能也很强大。它是Photoshop的专用格式,里面可以存放图层、通道等多种设计草稿。 6. TIFF TIFF图像格式适合于广泛的应用程序,与计算机的结构、操作系统和图形硬件无关。TIFF的格式灵活易变,因此,对于媒体之间的数据交换,TIFF是位图模式的最佳选择之一。 7. SVG SVG是Scalable Vector Graphics的缩写,表示可缩放的矢量图像。它是一种开放标准的矢量图像语言,可以设计激动人心的、高分辨率的Web图像页面。 8. 三种常用的Web图像格式对比 虽然有很多种计算机图像格式,但由于受网络带宽和浏览器的限制,Web上常用的图像格式只包括以下 3 种: GIF、JPEG 和 PNG。这三种图像格式的对比如表32所示。表32Web上三种图片格式对比 图像格式压缩格式色彩数量是否支持背景透明是否支持透明度是否支持动画GIF有损压缩256色支持不支持支持JPEG有损压缩224≈1600万色不支持支持支持PNG无损压缩248≈3200万色支持不支持支持3.1.6图像信号的分类 数字化图像,可以是通过采样、量化及编码后获取到计算机中的。这种图像是通过对离散化后的像素信息进行数字化而得到的,也称为位图图像。如果一个数字化图像直接就是在计算机中生成的,它的数字化信息则可能不是离散信息的描述,于是就产生了另外一类数字图像信号,即矢量图形。位图图像如图35所示,矢量图形如图36所示。 图35位图图像 图36矢量图形 位图图像(Bit Mapped Image)指在空间和亮度上已经离散化了的图像,又称点阵图。它由数字阵列信息组成,阵列中的各项数字用来描述构成图像各个像素的亮度与颜色信息。位图图像可以分为单色图像、灰度图像和彩色图像,如表33所示。表33位图图像的分类 单色图像(或二值图像)灰度图像彩色图像图像中只有黑白两种颜色,“0”表示黑,“1”表示白,每个像素只用一个二进制位表示图像中把灰度分成256个等级,用灰度表示层次,每个像素用8个二进制数表示图像把每种颜色分成若干等级,每个像素用多个二进制数表示。如256色图像,每个像素用8个二进制数表示;真彩色图像,每个像素至少用24个二进制数表示矢量图形是以由数学公式所定义的直线和曲线组成的,内容以线条和色块为主。它不易制作色调丰富或色彩变化太多的图形,并且绘出来的图不是很逼真。编辑矢量图形的软件通常有CorelDRAW、Illustrator、AutoCAD等。矢量图形与位图图像的对比如表34所示。表34矢量图形与位图图像比较 图像类型文件内容文件容量显示速度应用特点矢量图形图形指令与图的复杂程度有关图越复杂,需要执行的指令越多,显示越慢易于编辑,适合“绘制”,但表现力受限位图图像图像点阵数据与图的尺寸及色彩有关与图的内容有关适合“获取”和“复制”,表现力丰富,但编辑复杂3.2图像颜色构成 视觉是人们认识世界的窗口。客观世界作用于人的视觉器官,通过视觉器官形成信息,从而使人产生感觉和认识。 3.2.1颜色的来源 由于内部物质的不同,物体受光线照射后产生光的分解现象。一部分光被吸收,其余的被反射或折射出来,成为所见物体的颜色。所以,颜色和光有着密切的关系。 颜色是人的视觉系统对可见光的一种感知结果,感知到的颜色由光波的频率决定。 光波是一种具有一定频率范围的电磁波。电磁波中只有一小部分能够引起眼睛的兴奋而被感觉。 按照电磁波的波长顺序排列,光波可以表示为图37(a)所示的电磁波谱,其中,可见光的波长范围很窄,大约为380~780mm,如图37(b)所示。 图37电磁波谱与可见光谱3.2.2颜色空间 自然界中的颜色可以分为非彩色和彩色两大类。非彩色指黑色、白色和各种深浅不一的灰色,而其他所有颜色均属于彩色。 颜色空间是组织和描述颜色的方法之一,也可以称为颜色模型。 在一个典型的多媒体计算机系统中,常常有几种不同的颜色空间表示图形和图像的颜色,以对应不同的场合和应用。 HSB颜色空间: 用色调(Hue)、饱和度(Saturation)、亮度(Brightness)来描述颜色,更符合人的视觉特征。 RGB颜色空间: 用于计算机彩色显示器。 CMYK颜色空间: 用于彩色印刷系统或彩色打印机。 YUV(PAL制)和YIQ(NTSC制)颜色空间: 用于现代彩色电视系统。 Lab颜色空间: 颜色对立空间, L 表示亮度,a 和 b 表示颜色对立维度。 不同的颜色空间只是同一个物理量的不同表示法,因而它们之间存在相互转换的关系,这种转换可以通过数学公式的运算而得。 在实际应用中,一幅图像在计算机中用RGB颜色空间显示;在彩色电视系统中用YUV或YIQ颜色空间表示;在计算机图像处理中用RGB颜色空间或HSB颜色空间编辑;在打印和印刷输出时要转换成CMYK颜色空间。 3.2.3HSB颜色空间 人们对颜色的描述称为HSB颜色空间。对人的视觉感官来说,任何一种彩色都具有色相(H)、饱和度(S)和亮度(B)三个属性。非彩色只有亮度特征,没有色相和饱和度之分。 色相(Hue)——人眼看到一种或多种波长光时所产生的颜色感觉,它反映了颜色的种类,是决定颜色的基本特性。有时候也称为色调。 饱和度(Saturation)——也称为纯度,即色度中灰色分量所占的比例。通常使用0(灰色)~100%(纯色)的百分比来度量。 亮度(Brightness)——光作用于人眼睛时所引起的明亮程度的感觉。通常使用0(黑色)~100%(白色)的百分比来度量。 3.2.4RGB颜色空间 相对于HSB颜色空间来说,另一种RGB颜色空间则是一个与设备相关的、颜色描述不完全直观的颜色空间。这种颜色空间很难看出其所表示的颜色的认知属性,却可以方便地转变成所需要的其他任何颜色空间。 不同于绘画中使用的三原色原理,自然界中常见的各种颜色光,都可以由R(Red)、G(Green)、B(Blue)三种颜色的光按照不同比例相配而成,RGB颜色空间的颜色构成可以简化地用图38表示,图38RGB颜色空间的颜色构成图中的Y表示黄色(Yellow)、M表示Magenta(品红)、C表示青(Cyan)。三种基色按不同比例进行合成,就可以引起视觉不同的颜色感觉,合成彩色光的亮度由三基色的亮度之和决定,色度由三基色分量的比例决定。三基色彼此独立,任一种基色不能由其他两种基色配出。随着三基色选取的不同,可以构成任意多种颜色,这就是三基色原理,或称为RGB原理。 计算机显示器的色彩是由RGB三种色光合成的,可通过调整三个基色调校出其他的颜色。许多图像处理软件都有提供色彩调配的功能,可以输入R、G、B各自的数值来调配颜色,也可以直接根据软件提供的调色板来选择颜色。通常情况下,RGB各有256级亮度,用数字表示为0~255。RGB色彩共能组合出约1 678万种色彩(即256×256×256=16 777 216)。对于单独的R、G或B而言,当数值为0时,代表这种颜色不发光,如果为255,则该颜色为最高亮度。图39列出的是在软件中进行色彩调配时不同的R、G、B数值调配出的颜色示例,并可以看出RGB颜色空间与其他颜色空间是具有对应关系的。 图39不同R、G、B数值与其对应的颜色示例 RGB模式是显示器的物理色彩模式。这就意味着无论在软件中使用何种色彩模式,只要是在显示器上显示的,图像最终就是以RGB方式显示出来。 3.3图像的获取与处理 数字图像处理又称为计算机图像处理,它是指图像信号转换成数字信号并利用计算机对其进行处理的过程。 数字图像处理的核心是矩阵运算。对于灰度图像而言,一幅M像素高和N像素宽的图像可以表示为一个M×N的矩阵。对于彩色图而言,可以将彩色图像分为R、G、B共3个分量,对每个分量而言,也分别是一个M×N的矩阵。 一般来说,对图像进行处理,主要目的有以下三个方面: (1) 提高图像的视觉质量,如进行图像的亮度、彩色变换,增强、抑制某些成分,对图像进行几何变换等,以改善图像的质量。 (2) 提取图像中包含的某些特征或特殊信息,这些被提取的特征或信息往往为计算机分析图像提供便利。提取特征或信息的过程是模式识别或计算机视觉的预处理。提取的特征可以包括很多方面,如频域特征、灰度或颜色特征、边界特征、区域特征、纹理特征、形状特征、拓扑特征和关系结构等。 (3) 图像数据的变换、编码和压缩,以便于图像的存储和传输。 3.3.1常用图像处理软件〖*2〗1. Adobe产品系列在Adobe产品系列中,有多种与图像处理有关的产品。其中,Photoshop专注于图像编辑和合成。Lightroom可以随时随地编辑、整理、存储和共享照片。Illustrator用于创建矢量图形和插图,InDesign则面向印刷和数字出版的页面设计和布局。针对不同的领域,可以选择适用的产品。 本章大部分实验使用Adobe Photoshop CC 2017作为工具软件,其工具栏包含丰富的图像处理工具,如图310所示。 图310Adobe Photoshop CC 2017工具栏 2. CorelDRAW CorelDRAW是一款强大的多功能图形设计软件。它内置大量工具,功能强大且简单易用,可帮助设计者丰富设计。它具有超过1000种顶级字体、1000张专业高分辨率数码照片、10 000张通用剪贴画以及350个专业模板,帮助用户完成更高质量的项目设计;CorelDRAW的标牌、传单、名片、车身贴等Web图形设计成果可输出到各种介质,支持超过 100 种文件格式,包括 AI、PSD、PDF、JPG、PNG、EPS、TIFF、DOCX 和 PPT。 3. 光影魔术手 光影魔术手是一款简单易用的免费图片处理工具。使用光影魔术手可以对图片进行轻松的后期处理,快速美化、调整图片,还可以快速批量地对图片进行调整大小、添加水印等操作。 4. 美图秀秀 美图秀秀是一款简单易用的免费图片处理工具。它提供的图片特效、美容、拼图、场景、边框、饰品等功能,加上每天更新的精选素材,可以短时间制作出影楼级照片。美图秀秀有iPhone版、Windows Phone版、Android版、iPad版及网页版。 3.3.2图像获取与处理实验〖*4/5〗实验31数字化图像的基本属性实验31数字化图像 的基本属性(1) 实验要求。 使用SnagIt将计算机显示器的全屏幕信息捕获为一张图片,分别将其保存为BMP、GIF、JPG、PNG格式的图片。查看4种文件的属性,填写表35。表354种图像文件属性 文件格式文件大小分辨率位深度BMP宽度: 高度: GIF宽度: 高度: JPG宽度: 高度: PNG宽度: 高度: (2) 实验目的。 了解数字化图像的基本属性及查看方法。 (3) 预备知识。 本实验演示选择SnagIt为截屏工具,实验者也可以选择其他屏幕截图工具。 注: SnagIt是TechSmith公司一款著名的屏幕、文本和视频捕获、编辑和转换软件,可以捕捉、编辑计算机显示器屏幕上的各种对象,如屏幕范围、窗口、全屏幕、滚动窗口及Web页、菜单的时间延迟等,并可进行基本的编辑、处理及保存图像的工作,SnagIt的主界面如图311所示。 图311SnagIt主界面 (4) 实验步骤。 步骤1: 使用SnagIt的“全屏幕”捕获方案捕获当前计算机显示器上的全屏幕,并分别存储为BMP、GIF、JPG、PNG格式的文件。右击文件,查看文件的属性信息,将信息填写在表格的对应空白处。 步骤2: 以BMP格式为例,右击该文件,在图312所示的“常规”选项卡中可以看到文件大小为3.00MB,在图313所示的“详细信息”选项卡中则可以查看到该图像的分辨率,即宽度像素值与高度像素值。通过实验也能够清晰看出,同样一幅分辨率的数字化图像,将其编码保存为不同压缩格式时,文件大小会有差异。 图312图片属性的“常规”选项卡 图313图片属性的“详细信息”选项卡 实验32了解位图图像 实验32了解位图图像(1) 实验要求。 在Adobe Photoshop CC 2017中打开素材图片“实验32.jpg”,按要求完成以下操作,并填写表36中的空白信息。表36位图图像信息 操作存储为位深度文件大小放大32倍后的区域截图1. 打开“实验32.jpg”1.bmp242. 将图片模式转换为灰度2.bmp83. 将图片模式转换为位图(单色)3.bmp1(2) 实验目的。 理解数字化位图图像在计算机中的存储方式,理解数据量与图像质量的关系。 (3) 实验步骤。 步骤1: 进入Adobe Photoshop CC 2017;依次单击“文件”→“打开”,选择“实验32.jpg”素材文件,将其打开。在菜单栏中选择“图像”→“模式”,可以看到素材图片的图像模式是RGB颜色模式,如图314所示,R(红)、G(绿)、B(蓝)每个通道的二进制位数为8位,即图像位深度为24,且此素材图片是一个JPEG压缩格式的图片。 图314图像→模式 步骤2: 单击“文件”→“存储为”,将其保存为原始编码不经压缩的BMP格式图像,在BMP选项中选择文件格式为Windows格式,图像深度为24,如图315所示。将文件名保存为1.bmp后查看1.bmp的属性,在“常规”选项卡中可以看到文件的大小如图316所示。将此值填写在表格的对应空白处。 图315“BMP选项”对话框 图316BMP图片属性“常规”选项卡 步骤3: 在Photoshop工具箱中使用放大镜工具,对图片进行32倍放大,如图317所示,并使用SnagIt的“范围”捕获方案捕获放大后图片的其中一部分,粘贴到表格的对应空白处,捕获放大区域的操作如图318所示。 图317使用“放大镜”放大图像 图318使用SnagIt捕获放大区域 步骤4: 继续完成步骤2,单击“图像”→“模式”,将1.bmp图像转变为“灰度”模式,存储为2.bmp,图像位深度为8,转换过程如图319所示。在转换过程中,因为要丢掉彩色信息,会弹出图320所示的信息。使用放大镜对图像进行放大,捕获图片区域的过程如图321所示,填写表格中的空白信息。 图319将图像模式转换为“灰度” 图320“扔掉颜色信息”提示 图321使用SnagIt捕获部分灰度图像区域 步骤5: 继续完成步骤3,单击“图像→模式”,将2.bmp图像转换为“位图”模式,这里的“位图”实质是“单色图像”,也称为“二值图像”,图像位深度为1,只有黑和白两种颜色。转换过程如图322所示,期间会弹出设置位图分辨率的信息,如图323所示。将图像存储为3.bmp后,使用放大镜放大图像,捕获的图片区域如图324所示,填写表格中对应的空白信息。 图322将图像模式转换为“位图” 图323设置位图分辨率 图324使用SnagIt捕获部分位图图像区域 实验33选区的灵活选取 (1) 实验要求。 实验33选区的灵活选取 将素材图片“实验33.jpg”中的4样物体,即镜头盖、键盘、记事本、鼠标分别选取出来,放置到一幅新建的图片中,素材图片及标注物如图325所示。 图325素材图片及标注物 (2) 实验目的。 学会使用选择工具库,包括规则选取工具组、套索工具组、快速选取工具组,灵活使用工具选取需要的图像区域;学会新建图片;学会移动所选区域到新位置;学会保存新建文件。选择工具库的主要工具如表37所示。表37工具库主要工具工具示意图工具名称工具作用选框工具可以建立矩形、椭圆、单行和单列选区移动工具可以移动选区、图层和参考线套索工具可以建立手绘图、多边形(直边)和磁性(紧贴)选区快速选择工具可以使用可调整的圆形画笔笔尖快速“绘制”选区魔棒工具可以选择着色相近的区域(3) 实验步骤。 步骤1: 进入Adobe Photoshop CC 2017,打开素材图片实验33.jpg。如果想将“镜头盖”所在区域的像素全部选取出来,需要判断它的形状是否规则。如果可以使用选框工具组中的椭圆选框工具选择,则鼠标选择此工具,此时光标会变为一个十字形状,拖动即可选取出一个椭圆区域,选取过程如图326所示。当然,如果不能一次选取成功,也可以使用菜单栏“选择”菜单下的多种选择工具,如图327所示,例如“取消选择”“扩大选取”“变换选区”等对选区进行调整。被选取的区域会有发光的点画线标明。 图326使用选框工具选择选区 图327“选择”菜单 另外,菜单栏下方会有一个工具属性栏,如图328所示,可以根据需要调整属性取值。例如,椭圆选框工具后方即有“新选区”“添加到选区”“从选区减去”“与选区交叉”四种选取运算方法,并可对选区进行羽化、消除锯齿等操作。 图328工具属性栏 步骤2: 选取完“镜头盖”像素区域后,希望把这些像素移动到一个新图片中。此时需要选择菜单“文件”→“新建”,打开图329所示的“新建文档”窗口,自定义新建图片的大小,单击右下角的“创建”按钮,新打开一个空白的图像。在素材图片“实验33.jpg”上使用工具栏上的“移动工具”,即可将刚才选取的选区移动到新建的图像上(为方便操作,可以把新建图像的窗口拖曳出来,形成浮动面板),移动后的效果如图330所示。 图329新建文档窗口 图330移动选区到新建文档 步骤3: 选择“鼠标”选区,它的像素区域不是一个规则的选框,可以尝试“套索工具组”和“快速选取工具组”。例如,选择“套索工具”,拖动鼠标,沿选区边缘选取出一个封闭像素区域,选区的精确与否受控于手工选取的精细度。如果改用“磁性套索工具”,拖