第 4 章静态图像信息处理

第 4 章静态图像信息处理

学习目标

了解多媒体数据压缩编码的重要性和分类

掌握图像数据压缩编码常用算法的基本原理

了解常用图形、图像文件的基本格式及特点

理解静态图像压缩标准 JPEG 的工作原理和实现技术

了解图像信息获取的基本原理和方法

掌握用 Photoshop 处理图像的基本方法

第 4 章静态图像信息处理

图像处理就是将客观世界中的物体映射成数字化图像，然后用数学方法通过编程在计算机中进行处理、存储和显示。与数字音频类似，数字图像的数据量一般都比较大，在存储时会占用大量的空间，因此需要对图像进行压缩编码。本章主要介绍色彩的基本概念和表示方法、图像数据压缩的基本算法、图像的存储和编辑处理的基本方法。

4.1 彩色空间表示及其转换

4.1.1 颜色的基本概念 1 ．亮度、色调和饱和度彩色可用亮度、色调和饱和度来描述，人眼看到任意彩色光都是这三个特性的综合效果。亮度是发射光或物体反射光明亮度程度的量度色调是由于某种波长的颜色光使观察者产生的颜色感觉，每个波长代表不同的色调。它反映颜色的种类，决定颜色的基本特性，例如红色、棕色等都是指色调。某一物体的色调，是指该物体在日光照射下所反射的各光谱成分作用于人眼的综合效果，对于透射物体则是透过该物体的光谱综合作用的结果。

1 ．亮度、色调和饱和度

饱和度是颜色强度的度量。对于同一色调的彩色光，饱和度越深颜色越鲜明或者越纯。例如红色和粉红色的区别，虽然这两种颜色有相同的主波长，但一种也许是混合了更多的白色在里面，因此显得不太饱和。饱和度还与亮度有关，因为若在饱和的彩色光中增加白光的成分，这增加了光能，因而变得更亮了，但它的饱和度却降低了。通常把色调、饱和度统称为色度，上述内容总结为亮度表示某彩色光的明亮程度，而色度则表示颜色的类别与深浅程度。

2 ．三基色（ RGB ）原理

自然界常见的各种颜色光，都可由红（ R）、绿（G）、蓝（ B ）三种颜色按不同的比例相配而成，这就是色度学中最基本的原理——三基色原理。三基色的选择必须遵循一条规律：任一种颜色都不能由其他两种颜色合成。因为人的眼睛对红、绿、蓝这三种色光最敏感，因此，以这三种颜色作为基色相配来获得彩色得到了最为广泛的应用。

把三种基色光按不同的比例相加称之为相加混色。某种颜色和这三种颜色之间的关系可用下面的式子来描述：R （红色的百分比）＋ G （绿色的百分比）＋ B （蓝色的百分比）＝颜色用公式表达如下：红色（ 100%） + 绿色（ 100%） + 蓝色（ 0%）= 黄色红色（ 100%） + 蓝色（ 100%） + 绿色（ 0%）= 品红绿色（ 100%） + 蓝色（ 100%） + 红色（ 0%）= 青色红色（ 100%） + 绿色（ 100%） + 蓝色（ 100%）= 白色

我们称青色、品红和黄色为红、绿、蓝三色的补色，从图 4-1中还可以看出：红色 + 青色 = 绿色 + 品红= 蓝色 + 黄色= 白色

4.1.2 色彩的空间表示

在多媒体系统中常涉及到用几种不同的色彩空间表示图形和图像的颜色，如计算机显示时采用 RGB 彩色空间或色彩模型；在彩色全电视数字化时使用 YUV 色彩模型；彩色印刷时采用 CMYK 模式等。不同的彩色空间对应不同的应用场合，在图像的生成、存储、处理及显示时对应不同的彩色空间，需要做不同的处理和转换。

1． RGB 彩色空间由于某种颜色可以由红（ R）、绿（G）、蓝（ B）三种色光按不同的比例相加混色来得到，如果将 R、G、 B看成三个变量，就形成 RGB三维彩色空间。在多媒体计算机中，用的最多的是 RGB彩色空间。不管其中采用什么形式的彩色空间表示方法，多媒体系统最终的输出一定要转换成 RGB空间表示。对任意彩色光 F ，其配色方程可写成：F=r[R]+g[G]+b[B]

其中 r、 g 、 b 为三色系数 r[R]， g[G]，b[B]为 F 色光的三色分量。任意一种色光，其色度可由相对色系数中的任意两个唯一的确定。因此，各种彩色的色度可以用二维函数表示。用 r和 g 作为直角坐标系中两个直角坐标所画的各种色度的平面图形，就叫 RGB 色度图，如右图。

2． HSI 色彩空间

HSI 色彩空间指从人的视觉系统出发，用色调（ hue）、色饱和度（ saturation或 chroma ）和亮度（ intensity或 brightrless ）来描述色彩。 HSI 色彩空间可以用一个圆锥空间模型来描述，其中以亮度 I 为纵轴，色调 H 为绕着圆锥截面度量的色环，色饱和度 S 为穿过中心的半径横轴。亮度值是沿着圆锥的轴线度量的，沿着圆锥轴线上的点表示完全不饱和的颜色。按照不同的灰度等级，最亮点为纯白色，最暗点为纯黑色。圆锥截面的圆周一圈上的颜色为完全饱和的纯颜色。

人的视觉对亮度的敏感程度远强于对颜色浓淡的敏感程度，当图像亮度有变化时视觉反应明显，而当颜色浓淡有变化时视觉往往没有反应。由于 HSI 色彩空间更接近人对色彩的认识和解释，因此采用 HSI 方式能够减少彩色图像处理的复杂性，提高处理速度。在图像处理和计算机视觉中大量算法都可在 HSI 色彩空间中方便地使用，它们可以分开处理而且是相互独立的。因此，用 HSI 色彩空间可以大大简化图像分析和处理的工作量。HSI 色彩空间和 RGB 色彩空间只是同一物理量的不同表示法，因而它们之间存在着转换关系，如公式（ 4-1 ）所示。彩色图像的获取可采用 RGB 空间，图像的编辑可采用 HSI 空间。

)],180;,0()3

arctan(90[360

1BGBG

FH

其中：

3

),,min(1

B-G

B-G-2RF

BGRI

I

BGRS

（ 4-1 ）

3． YUV和 YIQ 彩色空间在彩色电视制式中，图像是通过 YUV和 YIQ 空间来表示的。 PAL 彩色电视制式使用 YUV 模型， Y 表示亮度， UV 用来表示色差， U、 V 是构成彩色的两个分量。 YUV 彩色空间中，三管彩色摄像机或 CCD 摄像机就是把拍摄的彩色图像，经分色棱镜分成 R0G0B0 信号，然后进行放大和 γ 校正得到 RGB ，再经过矩阵变换电路得到亮度信号 Y 、色差信号R-Y和 B-Y ，发送端将 Y、 R-Y及 B-Y 三个信号进行编码，用同一信道发送出去。

YUV表示法中，亮度信号（ Y）和色度信号（U、 V）是相互独立的。其中， Y 信号分量构成黑白灰度图， U、 V 信号构成另外两幅单色图。利用 YUV 分量之间的独立性原理，黑白电视能接收彩色电视信号，解决了黑白电视和彩色电视的兼容问题。 YUV 表示法可以利用人眼的特性来降低数字彩色图像所需要的存储容量。

美国、日本等国家采用的 NTSC 电视制式选用 YIQ 彩色空间， Y 仍为亮度信号， I、 Q 仍为色差信号，与 U、 V 不同的是，在它们之间存在着一定的转换关系。人眼的彩色视觉特性表明，人眼分辨红、黄之间的颜色变化的能力最强，而分辨蓝色与紫色之间的变化的能力最弱。通过一定的变换， I对应于人眼最敏感的色度，而 Q对应于人眼最不敏感的色度。在考虑人的视觉系统和阴极射线管（ CRT ）的非线性特性之

后， RGB和 YUV 的对应关系可以近似的用方程式 4-2 表示：Y = 0.299R + 0.587G + 0.114BU = -0.147R-0.289G + 0.436B （ 4-

2 ） V = 0.615R-0.515G-0.100B

或者写成矩阵的形式：

B

G

R

V

U

Y

100.0515.0615.0

436.0289.0147.0

114.0587.0299.0

RGB和 YIQ的对应关系用方程式 4-3 表示： Y=0.299R + 0.587G + 0.114B I=0.596R - 0.275G - 0.321B （ 4-

3 ） Q=0.212R - 0.523G + 0.311B

4． YCrCb 彩色空间 YCrCb 彩色空间是由 YUV 彩色空间派生的一种颜色空间，主要用于数字电视系统。是数字视频信号的世界标准。基本上， YCrCb代表和 YUV 相同的彩色空间。在这两个彩色空间中 Y 表示明亮度，也就是灰阶值；而 U和 V表示的则是色度，作用是描述影像色彩及饱和度，用于指定像素的颜色。“亮度”是通过 RGB输入信号来创建的，方法是将 RGB 信号的特定部分叠加到一起。“色度”则定义了颜色的两个方面——色调与饱和度，分别用 Cr和 Cb 来表示。其中， Cr 反映了 RGB输入信号红色部分与 RGB 信号亮度值之间的差异。而 Cb 反映的是 RGB输入信号蓝色部分与 RGB 信号亮度值之同的差异。

数字域中的彩色空间变换与模拟域的彩色空间变换不同。它们的分量使用 Y 、 Cr和 Cb 来表示，与 RGB 空间的转换关系如公式 4-4 所示：

Y ＝ 0.299R+0.578G+0.114B Cr＝ (0.500R-0.4187G-0.0813B)+128

（ 4-4） Cb＝ (-0.1687R-0.3313G+0.500B)+128

5． CMY 彩色空间印刷机或彩色打印机就不能用 RGB 颜色来印刷或打印，它只能使用一些能够吸收特定的光波而反射其他光波的油墨或颜料来实现。油墨或颜料的三基色是青（ cyan）、品红（magenta ）和黄（ yellow），简称为CMY 。青色对应蓝绿色，品红对应紫红色。理论上说，任何一种由颜料表现的色彩都可以用这三种基色按不同的比例混合而成，这种色彩表示方法称 CMY 色彩空间表示法。由CMY 混合的色彩又称为相减混色。CMY又写成 CMYK 。在实际应用中，一幅图像在计算机中用 RGB 空间或其他空间表示并处理，最后打印输出时要转换成 CMY 空间表示。

4.2 图像数据压缩的基本算法 4.2.1 数据压缩编码简介

图像数据压缩的主要依据有两个：一是图像数据中有许多重复的数据，使用数学方法来表示这些重复数据就可以减少数据量；另一个依据是人眼睛对图像细节和颜色的辨认有一个极限，把超过极限的部分去掉，这也就达到了数据压缩的目的。有损压缩技术和无损压缩技术

基于数据冗余的压缩技术是无损压缩技术，而基于人眼视觉特性的压缩技术是有损压缩技术。实际上，图像压缩技术是各种有损和无损压缩技术的综合实现。

常见的图像数据冗余（ 1 ）空间冗余。在任何一幅图像中，均有由许多灰度或颜色都相同的邻近像素组成的区域，它们形成了一个性质相同的集合块，即它们相互之间具有空间（或空域）上的强相关性，在图像中就表现为空间冗余。（ 2 ）结构冗余。在有些图像的纹理区，图像的像素值存在着明显的分布模式。例如，方格状的板图案等，我们称此为结构冗余。已知分布模式，可以通过某一过程生成图像。

（ 3 ）时间冗余。这是序列图像（电视图像、运动图像）表示中经常包含的冗余。图像序列中两幅相邻的图像有较大的相关，这反映为时间冗余。（ 4 ）视觉冗余。人类视觉系统的一般分辨能力估计为 26 灰度等级，而一般图像的量化采用的是 28的灰度等级。像这样的冗余，我们称之为视觉冗余。（ 5）知识冗余。有些图像的理解与某些知识有相当大的相关性。例如：狗的图像有固定的结构，比如，狗有四条腿，头部有眼、鼻、耳朵，有尾巴等。这类规律性的结构可由先验知识和背景知识得到，我们称此类冗余为知识冗余。空间冗余和时间冗余是将图像信号看作为随机信号时所反映出的统计特征，因此有时把这两种冗余称为统计冗余。

2．数据压缩方法的分类

根据编、解码后数据是否一致来进行分类，数据压缩的方法一般被划分为两类：

（ 1 ）可逆编码（无损编码）。此种方法的解码图像与原始图像严格相同，压缩比大约在 2:1~5:1 之间。主要编码有 Huffman 编码、算术编码、行程长度编码等。

（ 2 ）不可逆编码（有损编码）。此种方法的解码图像与原始图像存在一定的误差，但视觉效果一般可以接受，压缩比可以从几倍到上百倍调节。常用的编码有变换编码和预测编码。

根据压缩的原理分为如下几种

（ 1 ）预测编码。它是利用空间中相邻数据的相关性来进行压缩数据的。通常用的方法有脉冲编码调制（ PCM）、增量调制（ DM）、差分脉冲编码调制（ DPCM ）等。这些编码主要用于声音的编码

（ 2 ）变换编码。该方法将图像时域信号转换为频域信号进行处理。这种转换的特点是把在时域空间具有强相关的信号转换到频域上时在某些特定的区域内能量常常集中在一起，数据处理时可以将主要的注意力集中在相对较小的区域，从而实现数据压缩。一般采用正交变换，如离散余弦变换（ DCT）、离散傅

立叶变换（ DFT）（ 3 ）量化与向量量化编码。对模拟信号进行数字化时要经历一个量化的过程。为了使整体量化失真最小，就必须依据统计的概率分布设计最优的量化器。最优的量化器一般是非线性的，已知的最优量化器是 Max 量化器。我们对像元点进行量化时，除了每次仅量化一个点的方法外，也可以考虑一次量化多个点的做法，这种方法称为向量量化。即利用相邻数据间的相关性，将数据系列分组进行量化。

（ 4 ）信息熵编码。依据信息熵原理，让出现概率大的信号用较短的码字表示，反之用较长的码字表示。常见的编码方法有Huffman 编码、 Shannon 编码以及算术编码。（ 5）子带（ subband ）编码。将图像数据变换到频率后，按频率分带，然后用不同的量化器进行量化，从而达到最优的组合。或者分布渐进编码，在初始时，对某一个频带的信号进行解码，然后逐渐扩展到所有频带。

课后思考题

1. 图像有哪些基本属性？2 .什么是色调、饱和度和亮度？3.什么是矢量图？什么是位图？4.什么是真彩色？什么是真彩色图像？5. 简述加色原理和减色原理。6. 为什么数据可以被压缩？7 . 数据冗余有哪些类型？

4.2.2 信息熵及基本概念 1．信息量与信息熵信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量或含量，也就是在辨识 N 个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。设从 N 个数中选定任一个数 xj 的概率为 p（ xj ），假定选定任意一个数的概率都相等，即 p （ xj ）＝，因此定义信息量见公式 4-5 。定义信息量见公式4-5。

如果将信源所有可能事件的信息量进行平均，就得到了信息的“熵”，即信息熵。

)]([)(log1

loglog)( 222 jjj xpIxpN

NxI

式中， P(xj) 是信源 X 发出 xj 的概率。 I(xj) 的含义是，信源 X 发出 xj 这个消息（随机事件）后，接收端收到信息量的量度。

（ 4-5）

信源 X 发出的 xj（ j=1,2,…,n ）共 n个随机事件的自信息统计平均，即

H(X) 称为信源 X 的“熵”，即信源 X 发出任意一个随机变量的平均信息量。其中：等概率事件的熵最大，假设有 N个事件，由（ 4-6）式得此时熵为：

n

jjjj xPxPxIEXH

12 )(log)()}({)( （ 4-6 ）

NNN

XHN

j22

1

log1

log1

)(

当 P(x1)＝ 1 时， P(x2)＝ P(x3)＝…＝ P(xj)＝ 0 ，由（ 4-6 ）式得此时熵为

0)(log)()( 121 xPxPXH

NXH 2log)(0 由上可得熵的范围为：

在编码中用熵值来衡量是否为最佳编码。若以 Lc 表示编码器输出码字的平均码长，则当

Lc≥H(X) 有冗余，不是最佳。Lc＜ H(X) 不可能。Lc＝ H(X) 最佳编码（ Lc稍大于 H(X) ）。熵值为平均码长 Lc 的下限。

平均码长 Lc 的计算公式为：

n

jjjc xLxPL

1

)()( （ j=1,2,…,n ）（ 4-7 ）

其中： P(xj) 是信源 X 发出 xj 的概率， L(xj)为 xj 的编码长。

2 ．冗余度、编码效率与压缩比

设原图像的平均码长为 L ，熵为 H(X) ，压缩后图像的平均码长为 Lc ，则定义冗余度为（见公式 4-8 ）：（ 4-8）编码效率（见公式 4-9）：（ 4-9）压缩比（见公式 4-10 ）：

（ 4-1

0 ）

在数字图像通信系统中，冗余度、编码效率与压缩比是衡量信源特性以及编解码设备性能的重要指标。

1)(

XH

LR

RL

XH

1

1)(

cL

LC

4.2.3 信息熵编码信息熵编码也称为统计编码，是利用信息源出现的概率来进行编码，目前比较常见的信息熵编码包括哈夫曼编码、香农 -范诺编码、行程编码和算术统计编码等。

1．哈夫曼编码基本原理

依据信源字符出现的概率大小来构造代码，对出现概率较大的信源字符，给予较短码长，而对于出现概率较小的信源字符，给予较长的码长，最后使得编码的平均码字最短。

具体的编码步骤如下：（ 1 ）将信源符号出现的概率按由大到小的顺序排序。（ 2 ）将两处最小的概率进行组合相加，形成一个新的概率。（ 3）将新出现的概率与未编码的字符一起重新排序。（ 4 ）重复步骤（ 2 ）、（ 3），直到出现的概率和为 1 。（ 5）分配代码。代码分配从最后一步开始反向进行，对最后两个概率一个赋予 0代码，一个赋予 1 代码。如此反向进行到开始的概率排列。在此过程中，若概率不变则采用原代码。

例 4-1 ：设输入图像的灰度级 {a1,a2,a3,a4,a5,a6}出现的概率分别是 0.4 、 0.2 、 0.12 、 0.15、 0.1 、 0.03 。试进行哈夫曼编码，并计算编码效率、压缩比、冗余度。

编码步骤：（ 1 ）初始化，根据符号概率的大小按由大到小

顺序对符号进行排序，如图 4-2 所示。（ 2 ）把概率小的两个符号组成一个节点，如图

4-2 中的 a5、 a6组成节点 P1 。（ 3 ）重复步骤 2 ，得到节点 P2、 P3、 P4、

P5 ，形成一棵“树”，其中 P5 为根节点。（ 4 ）从根节点 P5开始到相应于每个符号的

“树叶”，从上到下标上 1 （上枝）或者 0 （下枝），至于哪个为 1 哪个为 0 则无关紧要，最后的结果仅仅是分配的代码不同，而代码的平均长度是相同的。

最终编码结果为： a1 =1, a2 =000 , a3 =011, a4 =001, a5 =0100, a6 =0101

由公式（ 4-6）可求得图像信源熵是：

H(X)=

=-（ 0.4×log20.4+0.2×log20.2+0.12×log20.12+

0.15×log20.15+0.1×log20.1+0.03×log20.03）

=2.25 bit

n

jjj xPxP

12 )(log)(

根据哈夫曼编码过程图给出的结果，由公式（ 4-7 ）可求出它的平均码字长度：

Lc=0.4×1+0.2×3+0.15×3+0.12×3+0.1×4+0.03×4 =2.33由公式（ 4-9 ）得编码效率为：

%6.9633.2

25.2

L

H

c

压缩之前 8 个符号需要 3 个比特量化，经过压缩之后的平均码字长度为2.33 ，由公式（ 4-10 ）得其压缩比为： 2.1

33.2

3C

由公式（ 4-8 ）得冗余度为： r = 1-η = 3.4%

采用哈夫曼编码时有两个问题值得注意：

（ 1 ）哈夫曼编码没有错误保护功能，在译码时，如果码串中没有错误，那么就能一个接一个的正确译出代码。但如果码串中有错误，哪怕仅是 1 位出现错误，不但这个码本身译错，更糟糕的是后面的译码可能全错，这种现象称为错误传播（ Error Propagation ）。

（ 2 ）哈夫曼编码是可变长度码，因此很难随意查找或调用压缩文件中间的内容，然后再译码，这就需要在存储代码之前加以考虑。

2．算术编码算术编码（ arithmetic coding AC ）是利用 0 和 1 之间的间隔来表示信源编码的一种方法，其编码值是间隔的上、下限包含的相同二进制。编码过程中的间隔决定了符号压缩后的输出。算术编码用到两个基本的参数：符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率，也决定编码过程中信源符号的间隔，而这些间隔包含在 0 到 1 之间。算术编码器的编码过程可用例 4-2 加以解释。

例 4-2 ：假设信源符号为 {A, B, C, D} ，这些符号的概率分别为 { 0.1, 0.4, 0.2, 0.3 } ，根据这些概率可把间隔 [0, 1] 分成 4 个子间隔： [0, 0.1], [0.1, 0.5], [0.5, 0.7], [0.7, 1] ，其中[x,y] 表示半开放间隔，即包含 x 不包含 y ，如表 4-1 所示。

符号 A B C D

概率 0.1 0.4 0.2 0.3

初始编码间隔

[0,0.1] [0.1,0.5] [0.5,0.7] [0.7,1]

表 4-1 信源符号、概率和初始编码间隔

如果消息序列的输入为： CADACDB ，其编码过程如下：首先输入的符号是 C ，找到它的编码范围是 [0.5, 0.7]；由于消息中第 2 个符号 A 的编码范围是 [0, 0.1] ，因此它的间隔就取[0.5, 0.7] 的第一个 1/10 作为新间隔 [0.5, 0.52]；

编码第 3 个符号 D 时取新间隔为 [0.514, 0.52]；编码第 4 个符号 A 时，取新间隔为 [0.514, 0.5146]，…。

消息的编码输出可以是最后一个间隔中的任意数，整个编码过程如图 4-3 所示。最后在 [0.5143876,0.51442] 中选择一个数作为编码输出值： 0.5143876 。

解码时，解码器由编码输出值： 0.5143876 ，可马上解得一个字符为 C ，然后依次得到唯一解 A,D,A,C,D,B 。

在算术编码中需要注意的几个问题：（ 1 ）由于实际的计算机的精度不可能无限长，运算中出现溢出是一个明显的问题，但多数机器都有 16 位、 32位或者 64位的精度，因此这个问题可使用比例缩放方法解决。（ 2 ）算术编码器对整个消息只产生一个码字，这个码字是在间隔 [0, 1)中的一个实数，因此译码器在接受到表示这个实数的所有位之前不能进行译码。（ 3 ）算术编码也是一种对错误很敏感的编码方法，如果有一位发生错误就会导致整个消息译错。

3．行程长度编码是一个针对包含有顺序排列的多次重复的数据的压缩方案。其原理就是把一系列的重复值用一个单独的值再加上一个计数值来取代，行程长度就是连续且重复的单元数目。如果想得到原始数据，只需展开这个编码就可以了。例如，计算机制作图像中，常常具有许多颜色相同的图块，而且在行上都具有相同的颜色，或者在一行上有许多连续的像素都具有相同的颜色值。这时，就不需要存储每一个像素的颜色值，而仅存储一个像素的颜色值以及具有相同颜色的像素数目就可以，或者存储一个像素的颜色值，以及具有相同颜色值的行数，这种压缩编码称为行程编码。具有相同颜色的连续的像素数目称为行程长度。

如图所示，假定一幅灰度图像，第 n 行的像素值为：

用 RLE 编码方法得到的代码为： 3150841160。代码斜黑体表示的数字是行程长度，黑体字后面的数字代表像素的颜色值。例如黑体字 50代表有连续 50个像素具有相同的颜色值，它的颜色值是 8。

对比 RLE 编码前后的代码数可以发现，在编码前要用 73 个代码表示这一行的数据，而编码后只要用 10 个代码表示代表原来的 73 个代码，压缩前后的数据量之比约为 7:1 ，即压缩比为 7:1 。这说明 RLE 确实是一种压缩技术，而且编码技术实用。

RLE 的性能好坏主要取决于图像本身的特点。 RLE压缩编码尤其适用于计算机生成的图像，对减少图像文件的存储空间非常有效。然而，由于颜色丰富的自然图像在同一行上具有相同颜色的连续像素往往很少，而连续几行都具有相同颜色值的连续行数就更少，如果仍然使用 RLE 编码方法，不仅不能压缩图像数据，反而可能使原来的图像数据变得更大。

译码时按照与编码时采用的相同规则进行，还原后得到的数据与压缩前的数据完全相同。因此， RLE属于无损压缩技术。

（补充）词典编码词典编码属于无损压缩技术，其根据是数据本身包含有重复代码序列这个特性。词典编码的种类较多，归纳起来有两类。第一类词典编码的基本思想是查找正在压缩的字符序列是否在前面输入的数据中出现过，如果是，则用指向早期出现过的字符串的“指针”替代重复的字符串。这种编码思想如图。

这里所指的“词典”是指用以前处理过的数据来表示编码过程中遇到的重复部分。这类编码中的所有算法都是以 Abraham Lempel 和 Jakob Ziv在 1977年开发和发表的称为 LZ77 算法为基础的， 1982年由 Storer和 Szymanski改进的称为 LZSS 算法。第二类算法的思想是从输入的数据中创建一个“短语词典”（ dictionary of the phrases ）（这种短语可以是任意字符的组合）。编码数据过程中，遇到已经在词典中出现的“短语”时，编码器就输出这个词典中该短语的“索引号”，而不是短语本身，如图。

J.Ziv和 A.Lempel在 1978年首次发表了介绍这种编码方法的文章。在他们研究的基础上， Terry

A.Weltch在 1984年发表了改进这种编码算法的文章，因此把这种编码方法称为 LZW（ Lempel-Ziv Walc

h）压缩编码。这种算法首先在高速硬盘控制器上得到了应用。在众多的压缩技术中， LZW 算法时一种通用的、性能优良并得到广泛应用的压缩算法。 LZW 是一种完全可逆的算法，与其他算法比较，往往具有更高的压缩效率，因此被广泛应用于多种流行的压缩软件中。

变换编码不是直接对空间域图像信号编码，而是首先将空间域图像信号映射变换到另一个正交矢量空间，产生一批变换系数，然后对这些变换系数进行编码处理。

图 4-5 显示了一个变换编码解码过程的示意图。变换编解码系统通过发送端将原始图像分割成 1 到 n个子图像块，每

个子图像块送入到正交变换器作正交变换，变换器输出变换系数经过滤波、量化、编码后送到信道传输到接收端，接收端作解码、逆变换、综合拼接，恢复出空域图像。

人们通过对大量自然景物图像的统计分析发现，绝大部分图像信号在空间域中像素之间的相关性是很大的。它们经过正交变换以后，其能量主要集中在低频部分；而且经过正交变换后的变换系数之间的相关性大大降低。

变换编码的基本思路就是利用上述特点，在编码时略去某些能量很小的高频分量，或在量化时对方差较小的分量分配以较少的比特数，以降低码率。另外，变换编码还可以根据人眼对不同频率分量的敏感程度而对不同系数采用不同的量化台阶，以进一步提高压缩比。

4.2.4 变换编码

变换编码的性能取决于子图像的大小、正交变换的类型、样本的选择和量化器的设计。

1．正交变换类型从均方误差最小和主观图像质量两个观点来看，最好的变换类型是离散

K-L 变换。但由于离散 K-L 变换的基核向量是不固定的，一般没有快速算法，因此只宜作理论分析和试验。

在数字信号处理技术中，傅里叶变换是应用最为广泛的一类正交变换，它不仅具有物理含义明确的优点，而且可以使用快速算法来减少运算量。但它应用在图像编码中时也有两个明显的弱点：一是要进行复数运算；二是收敛速度较慢。

变换压缩编码的基本依据是变换系数的方差比较集中。因此通常按系数方差大小作出变换系数的分布函数，以说明方差的集中程度。当原始图像为相关函数的高斯型一阶马尔可夫过程时，

离散余弦 DCT 可与最佳变换 K-L媲美，因为 DCT与 K-L 变换压缩性能和误差比较近，而且 DCT 也具有多种快速算法，因而在图像压缩编码中被广泛的应用。 DCT 变换具有如下特点：

•DCT 变换计算复杂度适中。•DCT 变换域系数矩阵能量集中在直流和低频区。•DCT 的直流系数近似满足瑞利分布，交流系数近似满足拉普拉斯分布。•DCT 系数相关性很小。

2 2

( , ) (0.95 ) k lr k l

在变换编码中，选择哪些变换系数进行量化编码，略去哪些系数不予传输，对变换压缩编码的性能有很大影响。原则上，应保留能量集中、方差大的变换系数予以编码传输。系数选择通常有两种方法：区域取样和门限取样。

2 ．样本选择与量化方案

门限取样：是把变换系数的方差和某个门限值比较，超过门限的会予以编码，否则舍弃。

•区域取样：是对设定形状内的变换系数进行量化编码，略去区域外的变换系数。由于 DCT 变换域系数矩阵能量集中在直流和低频区，则在图 4-6 所示的 DCT 系数中能量将主要集中在左上角的系数上。为此，可只传左上角上的系数，并按图中的“之”字形扫描路径输出系数。

在选定了要编码传输的系数后，有几种方法可以对其量化：（ 1 ）对所有变换系数分配相同的比特数。在发送端先对各变换系

数进行归一化，使它们变得有相同的方差，然后用一个统一的量化器对所有的系数进行量化及编码。在该方式下，由于接收端要把归一化的系数恢复回去，原来方差大的系数要乘大的倍数，因此量化误差大。（ 2 ）对方差大的变换系数分配较多的比特数，使比特数正比于该

系数方差的对数。可以证明，这样的分配方案可使量化造成的总均方误差最小。在该方式中，对不同的变换系数要用不同的量化器，它们之间不仅量化级数不同，判决电平和量化输出电平的变化规律也可以不同，以适合各自系数的分布规律。（ 3 ）利用人眼视觉特性设计量化器。由于人眼对不同空间频率的

失真敏感度不同，在比特分配时可对人眼较为敏感的变化系数分配较多的比特，而不太敏感的系数分配较少的比特。按这种方式设计的量化器可使变换编码系统总的主观图像质量较好。

变换编码中对变换域系数的量化是造成图像质量下降的主要原因，量化器设计的好坏将直接影响图像质量。变换编码中图像质量下降的主要表现形式是方块效应，也即在图像分块的边缘产生较易为人眼所察觉的误差。

3 ．子图像大小选择在变换编码系统中，考虑到矩阵变换所需的计算量、变换编码的性能和传输时误码的影响等因素，一般将图像分成若干小的子图像进行处理。从变换编码的压缩特性来看：子图像尺寸 n越大，所计入的相关像素越多，总的均方差性能越好。但根据对大量自然图像的统计分析结果，大多数图像仅在约 20 个相邻像素间有较大的相关性， n>16 后对性能的改善不大。变换编码对图像进行分块处理的另一特点，是可以将传输时误码造成的图像损伤限制在子图像范围内。显然，子图像尺寸越大误码造成的图像损伤范围越大；反之范围越小。综合考虑上述因素，一般子图像尺寸选为 8×8或 16×16 。

通常，图像中局部区域的像素是高度相关的，因此可以用先前像素的有关灰度知识来对当前像素的灰度进行估计，这就是预测。如果预测是正确的，则不必对每一个像素的灰度都进行压缩，而是把预测值与实际像素值之间的差值经过熵编码后发送到接收端 ,接收端通过预测值 + 差值信号来重建原像素。预测编码可分为线性预测编码和非线性预测编码。前者常被称为差分脉冲编码调制（ DPCM ），其基本原理是基于图像中相邻像素之间的相关性，每个像素可通过与之相关的几个像素来进行预测，如图 4-7 所示。

4.2.5 预测编码

图中 x(n)为采样的声音或图像数据，为 x(n)的预测值，

是实际值和预测值的差值，是 d(n)的量化值，

是引入量化误差的 x(n)。

)(~ nx

)(~)()( nxnxnd )(ˆ nd

)(ˆ nx

预测编码可以获得比较高的编码质量，并且实现起来比较简单，因此被广泛地应用于图像压缩编码系统。但是它的压缩比不高，而且精确的预测有赖于图像特性的大量的先验知识，并且必须进行大量的非线性运算，因此一般不单独使用，而是与其他方法结合起来使用。例如，在 JPEG 中使用了预测编码技术对DCT 直流系数进行编码。

1 ．模型编码模型编码则是利用计算机视觉和计算机图形学的知识对图像信号进行分析与合成。模型编码采用图像分析和描述的方法，将图像信号看成三维世界中的目标和景物投影到二维平面的产物，对图像的结构和特征进行分析，提取出图像的特征参数，如运动参数、形状参数等，并用某种模型加以描述，通过对模型参数的编码达到图像编码的目的。图像解码时，根据参数和模型先验知识用图像合成技术重建图像。由于编码的对象是特征参数，而不是原始图像，因此有可能实现比较大的压缩比。模型编码引入的误差主要是人眼视觉不太敏感的几何失真，因此重建图像非常自然和逼真。

4.2.6 其他编码方法

模型编码目前的研究目标主要集中于可视电话和会议电视的应用中。这是因为此类应用传送的图像中主要感兴趣的内容是人的头肩像，是一种基本固定的特定场景，因此可以预先建立人体头肩像的三维模型，从而进行模型编码。人的头肩像三维模型由人脸形状模型和脸部表情模型两部分组成。其形状模型可用许多小三角形的组合即“线框”（ Wireframe ）去逼近，脸部表情模型由“基本活动单元”（ Action Unit ）的线性组合来实现。通信时首先要将被传输对象的基本特征传送到对方，以建立人的头肩像三维模型；通信开始后，当头部发生运动、脸部表情发生变化时，抽取这些运动和变化的参数并对其进行编码发送给对方；接收端用已知的三维模型和收到的参数，用图像合成技术重建图像。由于头部运动和脸部表情参数变化是一种非刚体运动，精确的运动估值是相当困难的。目前采用的是在一定约束条件下建立在预测和反馈技术上的运动跟踪算法。

2 ．混合编码用两种或两种以上的方法对图像进行编码称为混合编码，是今年来广泛采用的一种方法。混合编码通常使用 DCT等变换进行空间冗余度的压缩，用帧间预测或运动补偿预测进行时间冗余度的压缩，以达到对运动图像的更高的压缩率。后面要介绍的 JPEG和MPEG 都属于混合编码。混合编码器有两种不同的结构，如图 4-8 所示，分别表示空 /时压缩和时 /空压缩两种不同的方案。图 4-8 是这两种方案的结构框图，其中 T、 IT代表正、反变换， Q、 IQ代表正、反量化。方案 I由于把变换部分放在预测环内，因此预测环本身工作在图像域内，便于使用性能优良、带有运动补偿的帧间预测，因而被广泛地应用于研究和使用；而方案 II 由于把变换部分放在预测环外，需要在变换域（频率域）进行预测，处理上不方便。方案 I经过若干年的研究总结后，发展为带有运动补偿性质的帧间预测与 DCT 结合的方案。这一方案具有压缩性能高、编码技术成熟，以及编码延迟短等特点，目前已成为运动图像压缩的主流方案。

练习1．当向蓝色中加进白色时，饱和度 _______。

A．不会变化 B．增强 C．降低 D．有时增强有时降低2．在 RGB 色彩模式中， R=B=G=0 的颜色是 _______。

A．白色 B．黑色C．红色D．蓝色3． _______色彩模式适用于彩色打印机和彩色印刷。

A． CMY B． HISC． RGB D． YUV

5．一幅 320×240 的真彩色图像，未压缩的图像数据量是 _______。A ． 225KB B ． 230 ． 4KB C ． 900KBD． 921． 6KB

6．下列说法正确是 _______。

A ．信息量等于数据量与冗余量之和

B ．信息量等于信息熵与数据量之差

C ．信息量等于信息熵与冗余量之和

D ．信息量等于数据量与冗余量之差

7．衡量数据压缩技术性能好坏的重要指标是 _______。

A ．压缩比 B ．算法复杂度 C ．恢复效果 D ．标准化

填空题

1．图像数据压缩主要根据两个基本事实来实现。一个是根据 _______，另一个是根据 _______。

2． A、 B、 C、 D 四个信号源以等概率出现，其信息熵是 _______bit/符号。

4.3 常用图形、图像文件的格式 4.3.1 矢量图和位图计算机包含两种类型的图形格式：矢量图（ Vector Based Image ）和位图（ Bit Mapped Image ）。1.矢量图 ( 图形图形 )) ：主要用于工程图、白描图、图例、卡通漫画和三维：主要用于工程图、白描图、图例、卡通漫画和三维建模等。建模等。由图形应用程序创建由图形应用程序创建 , , 在数学上定义为一系列由线连接的点，在数学上定义为一系列由线连接的点，其内部表示为单个的线条、文字、圆、矩形、多边形等图形元素。每个图其内部表示为单个的线条、文字、圆、矩形、多边形等图形元素。每个图元称为对象，可以用一个代数式来表达，并且是一个独立的实体，具有颜元称为对象，可以用一个代数式来表达，并且是一个独立的实体，具有颜色、形状、大小和屏幕位置等属性。色、形状、大小和屏幕位置等属性。通过软件，通过软件，矢量图很容易转化为位图，而位图转化为矢量图则需要复杂而庞大的数据处理。。

2.位图 ( 图像图像 )) ：：

是直接量化的原始图像信号形式是直接量化的原始图像信号形式 , 图像的最小单位是像点图像的最小单位是像点 , , 用于表现自然影用于表现自然影像。像素点由若干个二进制位进行描述，二进制位代表像素点颜色的数量，像。像素点由若干个二进制位进行描述，二进制位代表像素点颜色的数量，二进制位与图像之间存在严格的“位映射”关系，具有位映射关系的图叫二进制位与图像之间存在严格的“位映射”关系，具有位映射关系的图叫作“位图”。作“位图”。

3.位图与矢量图的不同点：：

1 ）位图的容量一般较大，与图的尺寸和颜色有关；矢量图一般较小，与图的复杂程度有关。2 ）位图的文件内容是点阵数据；矢量图的文件内容是图形指令。3 ）位图的显示速度与土的容量有关；矢量图的显示速度与图的复杂程度有关。4 ）从应用特点看，位图适于“获取” 和“复制”，表现力丰富，但编辑较复杂；矢量图易于编辑，适于“绘制” 和“创建”，但表现力受限。

4.3.2 常见的位图格式

1 ．图像的文件结构文件头的主要内容包括产生或编辑该图像文件的软件信息以及图像本身的参数。

文件体主要包括图像数据以及色彩变换查找表或调色板数据。这部分是文件的主体，对文件容量的大小起决定作用。

文件尾可包含一些用户信息。

文件头

软件 ID

软件版本号图像分辨率图像尺寸图像深度色彩类型编码方式压缩算法

文件体

图像数据色彩变换表

文件尾

用户名注释开发日期工作时间

表 4-2 位图文件结构示意

2 ． BMP 图像文件格式

是微软公司为其 Windows环境设置的标准图像格式。 Windows 系统软件中内含了一系列支持 BMP 图像处理的API 函数。非压缩格式是 BMP 图像文件所采用的一种通用格式。两种压缩方式：如果图像为 16 色模式，则采用 RLE4压缩方式；若图像为 256 色模式，则采用 RLE8压缩方式。可以存储单色、 16 色、 256 色以及真彩色 4 种图像数据。

3 ． GIF 图像文件格式

是最早由 CompuServe 公司于 1987年制定的标准，主要用于网络图形数据的在线传输和存储。 GIF 提供了足够的信息并很好地组织了这些信息，使得许多不同的输入输出设备能够方便的交换图像。它最多支持8 位（ 256 种颜色），图像的大小最多是 64K×64K个像点。 GIF 的特点是 LZW压缩、多图像和交错屏幕绘图。

4 ． JPEG 图像文件格式

JPEG（ Joint Photographic Experts Group ）图像格式是一种比较复杂的文件结构和编码方式的文件格式。它是用有损压缩方式去除冗余的图像和彩色数据，在获得极高压缩率的同时能展现十分丰富和生动的图像，适用于在 Internet 上作图像传输。 JPEG文件格式具有以下特点：适用性广，大多数图像类型都可以进行 JPEG 编码；对于数字化照片和表达自然景物的图片， JPEG 编码方式具有非常好的处理效果；对于使用计算机绘制的具有明显边界的图形， JPEG 编码方式的处理效果不佳。

5 ． TIFF 图像文件格式

是一种通用的位映射图像文件格式。 TIFF文件格式具有以下特点：支持从单色到 32位真彩色的所有图像；适用于多种操作平台和多种机器，如 PC 机和 Macintosh 机；具有多种数据压缩存储方式等。

6 ． PNG 图像文件格式

是 20世纪 90年代中期开发的图像文件格式，其目的是企图替代 GIF和 TIFF文件格式，同时增加一些 GIF文件格式所不具备的特性。 PNG 用来存储彩色图像时其颜色深度可达 48位，存储灰度图像时可达 16位，并且还可存储多达 16位的 Alpha 通道数据。 PNG文件格式具有以下特点：流式读写性能、加快图像显示的逐次逼近显示方式、使用从 LZ77派生的无损压缩算法以及独立于计算机软硬件环境等。

7 ． PSD 图像文件格式

是 Adobe 公司的图像处理软件 Photoshop 的专用格式。 PSD 其实是 Photoshop 进行平面设计的一张“草稿图”，它里面包含有各种图层、通道、蒙板等多种设计的样稿，以便于下次打开文件时可以修改上一次的设计。

8 ． PCX图像文件格式是 ZSOFT 公司在开发图像处理软件 Paint Brush 时开发的一种格式，存储格式从 1 位到 24位，它是经过压缩的格式，占用磁盘空间较少。它主要与商业性 PC-Paint Brush 图像软件一起使用。 PCX文件可以分成三类：各种单色 PCX文件、不超过 16 种颜色的 PCX文件、具有 256 颜色的 PCX 图像文件。由于该格式出现的时间较长，并且具有压缩及全彩色的能力，所以 PCX格式现在仍十分流行。表 4-3 中列出了常见的位图文件格式及其说明。

图片类型说明BMP 鲜艳、细腻，但尺寸大GIF 尺寸小，有小动画效果JPEG、 JPG 质量高，尺寸小，略失真TIFF、 TIF 用于扫描仪、 OCR系统PNG 适合在网络上传输及打开PSD Photoshp专用，图像细腻PCX 压缩比适中，能快速打开

表 4-3 常见的位图文件格式

4.3.3 常见的矢量图格式（ 1 ）WMF文件格式：是常见的一种图元文件格式，是它具有文件短小、图案造型化的特点，整个图形常由各个独立的组成部分拼接而成，但其图形往往较粗糙。 WMF文件的扩展名为 .wmf 。（ 2 ） EMF文件格式：是微软公司开发的一种 Windows 32位扩展图元文件格式。其总体目标是要弥补使用 WMF 的不足，使得图元文件更加易于接受。 EMF文件的扩展名为 .emf 。（ 3 ） EPS文件格式：是用 PostScript语言描述的一种 ASCII码文件格式，即可以存储矢量图，也可以存储位图，最高能表示 32位颜色深度，特别适合PostScript打印机。（ 4 ） DXF文件格式：是 AutoCAD 中的矢量文件格式，它以 ASCII码方式存储文件，在表现图形的大小方面十分精确。 DXF文件可以被许多软件调用或输出。 DXF文件的扩展名为 .dxf 。

（ 5 ） SWF（ Shockwave Format ）文件格式：是二维动画软件 Flash中的矢量动画格式，主要用于 Web页面上的动画发布。目前，已成为网上动画的事实标准。 SWF文件的扩展名为 .swf 。

4.4 静态图像压缩标准

4.4.1 JPEG 简介

JPEG（ Joint Photographic Experts Group ）是联合图像专家小组的英文缩写，这个专家组开发的算法称为 JPEG 算法，并且成为国际上的彩色、灰度、静止图像的第一个国际标准，因此又称为 JPEG 标准。JPEG 是一个适用范围很广的静态图像数据压缩标准，不仅适用于静止图像的压缩，也常常被用于电视图像序列的帧内图像压缩编码。目前 JPEG专家组开发了两种基本的压缩算法：一种是采用以离散余弦变换 DCT 为基础的有损压缩算法；另一种是采用以预测技术为基础的无损压缩算法。

使用有损压缩算法时，在压缩比为 25:1 的情况下，压缩后还原得到的图像和原始图像相比较，非图像专家难以找到它们之间的区别，因此得到了广泛的应用。例如在 V-CD和 DVD-Video 电视图像压缩技术中，就使用JPEG 的有损压缩算法来取消空间方向上的冗余数据。

JPEG压缩是有损压缩，它利用了人的视角系统的特性，使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。 JPEG 算法框图如图 4-9 所示，压缩编码大致分成三个步骤：（ 1 ）使用正向离散余弦变换（ Forward Discrete Cosine

Transform， FDCT ）把空间域表示的图变换成频率域表示的图。（ 2 ）使用加权函数对 DCT 系数进行量化，这个加权函数对于人的视觉系统是最佳的。（ 3 ）使用哈夫曼可变字长编码器对量化系数进行编码。

译码或者叫做解压缩的过程与压缩编码过程正好相反。JPEG 算法与彩色空间无关，因此“ RGB到 YUV 变换”和“ YUV到RGB 变换”不包含在 JPEG 算法中。 JPEG 算法处理的彩色图像是单独的彩色分量图像，因此它可以压缩来自不同彩色空间的数据，如RGB、 YCbCr和 CMYK 。

4.4.2 JPEG 压缩的基本原理 JPEG 压缩编码过程主要包含四个阶段：离散余弦变换（ DC

T）、量化、编码（ Ending Phase ）和组成位数据流阶段。下面我们通过一个简单的例子，分别阐述这四个阶段的原理。

1 ．离散余弦变换

（ 1 ）首先把一幅图像划分成一系列的图像块，每个图像块包含 8×8 个像素。如果原始图像有 640×480 个像素，则图片将包含 80列 60 行的方块。如果图像只包含灰度，那么每个像素用一个 8 比特的数字表示。因此可以把每个图像块表示成一个8 行 8 列的二维数组。数组的元素是 0 ～ 255的 8 比特整数。离散余弦变换就是作用在这个数组上。

如果图像是彩色的，那么每个像素可以用 24 比特、相当于三个 8 位比特的组合来表示（用 RGB或 YIQ 表示，在这里没有影响）。因此，可以用三个 8 行 8 列的二维数组表示这个 8×8 的像素方块。每一个数组

表示其中一个八位比特组合的像素值。离散余弦变换作用于每个数组。

DCT变换是做什么的？

简单的说，是用一个 8 行 8 列的二维数组产生另一个同样包含 8 行 8 列二维数组的函数，也就是说，把一个数组通过一个变换，变成另一个数组。如图下图所示，对每个图像块做离散余弦变换。通过 DCT 变换可以把能量集中在矩阵左上角少数几个系数上。

f(i,j)经 DCT 变换之后得到 F(i,j) ，其中 F(0,0)是直流系数，称为 DC 系数，其他为交流系数，称为 AC 系数。

（ 2 ）用 f表示像素值的数组， f（ i j ）表示 i行 j列的值，则离散余弦变换后定义一个新的数组 F (u ,v) ，表示 u行 v 列的值。

DCT 变换使用公式（ 4-11 ）计算：7 7

0 0

1 (2 1) (2 1), ( , ) cos cos ]

4 16 16i j

i u j vu v u v f i j

Ｆ（）= C( )C( )[ （ 4-11 ）

它的逆变换使用公式（ 4-12 ）计算：7 7

0 0

1 (2 1) (2 1), ( , ) cos cos ]

4 16 16u v

i u j vf i j u v F u v

（）= C( )C( )[ （ 4-12 ）

上面两式中， C(u), C(v) = ，当 u, v =0；C(u), C(v) = 1 ，其他。

1/ 2

图 4-11 显示了对一个源图像的 8×8 的图像样本的原始数组应用离散余弦变换的结果。为便于计算在对源数组 f进行变换之前首先对源图像中的每个样本数据减去了 128 。然后再按公式（ 4-11 ）分别计算出结果数组 F中每个数组元素的值。比如说，计算 F(0,0) 的值过程如下：

]16

)12(cos

16

)12(cos),()[()(

4

1)0,0(

7

0

7

0

i j

vjuijifvCuCF

]),()[0()0(4

1 7

0

7

0

i j

jifCC

18852

1

2

1

4

1

＝ 235.6

（因为 cos(0)=1 ）

这样再继续计算出数组中其余元素的值，得到数组 F 。

图 4-11 离散余弦变换的数组

f(i,j)经 DCT 变换之后得到 F(i,j) ，其中 F(0,0)是直流系数，称为DC 系数，其他为交流系数，称为 AC 系数。

（ 3 ）在计算二维的 DCT 变换时，也可使用下面的计算式（ 4-13 ）、（ 4-14 ）进行简化，把二维的 DCT 变换变成一维的 DCT 变换，如图 4-12 所示为二维 DCT 变换方法。

7

0

1 (2 1), ( , ) cos ]

2 16i

i uu v u G i v

Ｆ（）= C( )[ （ 4-13 ）

7

0

1 (2 1)( , ) ( , ) cos ]

2 16i

j vG i v v f i j

= C( )[ （ 4-14 ）

图 4-12 两维 DCT 变换方法

2 ．量化为了达到压缩数据的目的， DCT 系数需做量化。量化是对经过FDCT 变换后的频率系数进行量化，这是一个多到一映射的过程。量化的目的是减小非 0 系数的幅度以及增加 0 值系数的数目，在一定的主观保真的前提下，丢掉那些对视觉效果影响不大的信息，量化是图像质量下降的最主要原因。

对于有损压缩算法， JPEG 算法使用如图 4-13 所示的均匀量化器进行量化，量化步距是量化表的元素，它由系数所在的位置和每种颜色分量的色调值来确定。因为人眼对亮度信号比对色差信号更敏感，因此使用了两种量化表：如表 4-4 所示的色度量化值和表 4-5 所示的亮度量化值。此外，由于人眼对低频分量的图像比对高频分量的图像更敏感，因此图中左上角的量化步距要比右下角的量化步距小。表 4-4 和表 4-5 中的数值对CCIR 601 标准（国际无线电咨询委员会 CCIR[International Radio Consultative Committee]在 20世纪 80年代初制定的彩色电视图像数字化标准）电视图像已经是最佳的。如果不使用这两种表，你也可以用自己的量化表替换它们。

对于上面的例子，我们用表 4-4 的量化表对其进行量化，得到数组Q（ i,j）。量化的公式为：

Q(i,j)=Integer(F(i,j)/U(i,j))其中： U(i,j) 为量化数组中对应的数组元素。也就是用数组 F 中的各

元素分别除以量化数组Q中的相应元素，如图 4-14 所示。

图 4-14 用量化表量化的数组

以上是编码时对图像块的正向离散余弦变换和量化过程，解码的时候要进行逆量化和逆向离散余弦变换，图 4-15

说明了解码的过程，并且在逆向离散余弦变换之后对重构图像中的每个样本数据加了 128 ，最后得到重构图像样本：

3 ．编码阶段（ 1 ） Z 字形编排。对于量化后的二维数组，我们还要对其进行线性化，然后再进行压缩加以传输。一个合理的线性化方法可能是一次传输Q的一行。由于出现这么多的 0 ，可以使用行程编码。这是可行的，但还有更好的方法。

（ 2 ）直流系数的编码。 8×8 图像块经过 DCT 变换之后得到的 DC

直流系数有两个特点，一是系数的数值比较大，二是相邻 8×8 图像块的 DC 系数值变化不大。根据这个特点， JPEG 算法使用了差分脉冲调制编码（ DPCM ）技术，对相邻图像块之间量化 DC 系数的差值进行编码。

Delta = Dc(0,0)k-Dc(0,0)k–1 （ 4-15 ）

（ 3 ）交流系数的编码。量化 AC 系数的特点是 1×64矢量中包含有许多 0 系数，并且许多 0 是连续的，因此可以使用非常简单和直观的游程长度编码（ RLE ）对它们进行编码。JPEG 使用了 1 个字节的高 4 位来表示连续 0 的个数，而使用它的低 4位来表示编码下一个非 0 系数所需要的位数，跟在它后面的是量化 AC系数的数值。（ 4 ）熵编码。使用熵编码还可以对 DPCM 编码后的直流 DC 系数和RLE 编码后的交流 AC 系数作进一步的压缩。在 JPEG 有损压缩算法中，使用哈夫曼编码器来减少熵。

4 ．组成位数据流

JPEG 编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据，这样做的目的是为了便于传输、存储

和译码器进行译码，这样组织的数据通常称为 JPEG位数据流。

4.4.3 JPEG 2000

为了能用单一的压缩码流提供多种性能、满足范围更为广泛的应用， JPEG 工作组于 1996年开始探索一种新的静止图像压缩编码标准，

并且称它为 JPEG 2000 。 JPEG 2000是 JPEG 工作组制定的并于 2000年底陆续公布的基于JPEG 标准的最新的静止图像压缩编码的国际标准，它之所以比 JPEG

标准优越，主要是不再采用离散傅立叶变换 DCT 算法为主的编码方法，改用以 DWT（ Discrete Wavelet Transformation ，离散小波变换

算法）为主的多解析编码方法。

它与 JPEG 的基本系统相比有以下的优点：（ 1 ）既支持有损压缩，也支持无损压缩方式。（ 2 ）在压缩时，可指定图片感兴趣的区域，并指定压缩质量；在解压缩时，对这些区域指定解压缩顺序及解压缩质量。因为子波在时域及频域上具有局域性，有可能完全恢复或以高分辨率恢复图像的某个局部。（ 3 ）在高压缩比下，仍能保持较高的图像质量。在类似质量的前提下， JPEG 2000 的压缩比比 JPEG高 10%～ 30% 。

JPEG 2000 主要由 6 个部分组成：第一部分，图像编码系统，它是标准的核心系统。第二部分，扩展系统，在核心系统上添加一些功能。第三部分，运动 JPEG 2000 ，针对运动图像提出的解决方案。第四部分，兼容性。第五部分，参考软件。第六部分，复合图像格式，主要是针对印刷和传真应用。

（ 4 ）支持渐进式传输，即开始时显示一个模糊、不清晰且质量低的图像，随着数据进一步被接收，图像清晰度和质量逐步提高，最后显示出一个高清晰度且高质量的图像。 JPEG 2000 在节约和充分利用有限带宽方面显得更加优越。（ 5 ）在有限带宽上进行文件传输时，有很强的纠错能力，在用户指定文件尺寸时，能保证较高的再现图像质量，以致在无线领域得到广泛应用。（ 6 ）可对编码流进行随机访问和处理，因为它的块编码是独立的，且编码流具有包裹式结构。

（ 7 ）使用 Alpha 通道，以满足图形艺术和 Internet 的发展和需求；（ 8 ）在彩色图像处理方面， JPEG 2000 可处理 256个通道的信息。

标准 JPEG JPEG 2000

标题连续色调静止图像的数字压缩编码

新一代静止图像压缩编码

主要编码技术

离散余弦变换（ DCT）知觉量化Zigzag扫描霍夫曼编码算术编码

离散小波变化（ DWT）EBCOT核心算法ROI编码空间可扩展编码质量可扩展编码面向对象编码位图形状编码容错编码、 TCQ、零数扫描

压缩比 2～ 30 2～ 50

算法效率 30:1以上急剧下降 100:1以上急剧衰减

速率失真特性

比 JPEG提高 30%

应用场合 Internet数字照相图像视频编辑

Internet数字照相数字图书馆电子商务打印、扫描、传真、遥感

表 4-6 JPEG与 JPEG 2000 的性能比较

习题 4-3

1. 按照 JPEG 标准的要求，一幅彩色图像经过 JPEG压缩后还原得到的图像与原始图像相比较，非图像专家难于找出它们之间的区别，问此时的最大压缩比是_______ 。2 ． JPEG压缩编码算法的主要计算步骤是：① DCT变换；②量化；③ Z 字形编码；④使用 DPCM 对直流系数进行编码；⑤使用 RLE 对交流系数进行编码；⑥熵编码。假设计算机的精度足够高，问在上述计算方法中，哪些计算对图像的质量是有损的？哪些计算对图像的质量是无损的？

把自然的影像转换成数字化图像的过程叫做“图像获取过程”，图像获取过程的实质是进行模 /数（ A/D ）转换，即通过相应的设备和软件，把作为模拟量的自然影像转换成数字量。图像获取的一个重要途径是使用专用计算机扩展设备，如扫描仪、数码照相机等对图像进行获取。除硬件设备外，还需要设备驱动程序、图像处理工具等软件。图像的处理须通过图像处理软件完成，目前使用最广泛的是专业图像处理软件 Photoshop 7.0 。

4.5 图像的获取与处理

4.5.1 获取的途径图像的获取途径主要有两个：（ 1 ）利用彩色扫描仪和数码照相机等设备进行模 /数转换。对于收集的图像素材，如印刷品、照片以及实物等，使用彩色扫描仪对照片和印刷品进行扫描，经过少许的加工后，即可得到数字图像。使用数码照相机可直接拍摄景物，再传送到计算机中进行处理。（ 2 ）从数字图像库或网络上获取图像。数字图像库通常采用光盘作为数据载体，多采用 PCD文件格式和 JPG文件格式。其中， PCD文件格式是Kodak 公司开发的 Photo—CD 光盘格式； JPG文件格式是压缩数据文件格式。国际互联网络的某些网站也提供合法的图片素材，有些需要支付少量的费用。

4.5.2 用彩色扫描仪来获取图像用扫描仪获得高质量的图像依靠正确的扫描方法、设定正确的扫描参数、选择合适的颜色深度，以及后期的技术处理。ScanWizard扫描软件是现在相当普及的扫描软件 ,该软件具有编辑和修改功能，能够节约原本需在图像处理软件内进行修整的时间。1 ． ScanWizard扫描软件的功能（ 1 ）进行预扫描。单击“预视”键可完成真正扫描之前的预视结果，然后选择最后需扫描的范围，单击“扫描”键可开始扫描。（ 2 ）可以检查图像被修改过后的 RGB值。（ 3 ）可建立多项扫描。（ 4 ）可选择扫描图像的类型。它既可以按原格式进行扫描，也可以用别的格式扫描。例如：彩色图像也可采用灰度及线条方式进行扫描。（ 5 ）在预视提示下，图像可通过设置窗口中的图像增强工具进行调整。这些工具能调整诸如图像的亮度、对比度、暗调和高光或中间调、饱和度以及运用其他滤波器的特殊效果等。在图像增强对话框中，可实时对比处理前后的效果，且能直接切换至别的增强工具，该功能是ScanWizard扫描软件的主要特点。

2 ． ScanWizard扫描软件的四个作业窗口（ 1 ）预视窗口：包括控制扫描仪的各种命令和工具。（ 2 ）设置窗口：设置输出扫描图像的控制参数，包含整个系统软件的图像增强工具，以及类型、分辨率等各项参数。（ 3 ）图像信息窗口：显示预视图像的各种信息，如缩放值、像素以及色彩等。（ 4 ）扫描作业窗口：处理扫描作业的一些关键功能，如多任务设置等。

3 ． ScanWizard扫描软件的使用（ 1 ）打开电源，打开扫描仪上盖，将扫描原件有图像的一面贴着玻璃面放好，合上上盖。（ 2 ）启动图像扫描软件（以 PhotoShop 5 02 为例）。在“文件”菜单中选择“输入”，再选择“选择 TWAIN_32源”，在弹出的对话框中选择扫描仪，然后按“确定”按钮，接着仍然从“输入”菜单中选择TWAIN_32 。当 ScanWizard扫描窗口出现后，按下列步骤进行：1 ）在图像类型窗口中选择图像的色彩提示。2 ）单击“预视”，观察预扫描后的结果。3 ）在预视图像框中选出扫描范围，方法是：选中“扫描范围”工具，用鼠标在预视图中拉出一个范围框，其中的内容即为选择扫描的图像。4 ）可使用图像增强工具改善图像质量。5 ）设置适当扫描分辨率。6 ）单击“扫描”按钮，图像即被扫入图像处理软件中。7 ）要退出 ScanWizard扫描软件只需单击右上角的“关闭”按钮即可。

4 ．针对不同扫描对象的处理（ 1 ）扫描黑白图像（线条或半色调）。1 ）在设置窗口的图像类型下拉菜单中选择“线条图像”。2 ）单击预视窗口中的“预览”按钮，即可看到预扫描后的结果。3 ）选择“扫描范围”工具，在预视图中框选出需扫描的区域。4 ）选择适当的扫描分辨率，通常为 300dpi 。5 ）单击“扫描”按钮，即可将所框选的扫描范围内的图像输入到图像编辑软件中。（ 2 ）扫描灰度图像。1 ）在设置窗口的图像类型下拉菜单中选择“ 256灰度”。2 ）与“扫描黑白图像”步骤一致，此处需注意扫描分辨率的设置：如果使用热升华打印机，可设置为和打印机一样的分辨率；否则，将分辨率设置为 72dpi或 75dpi 。使用激光打印机或喷墨打印机时，设置为 75dpi至 100dpi 就可以了。如果使用 1200dpi～ 2400dpi 的照排机输出，扫描分辨率设为 300dpi 。

（ 3 ）扫描彩色图像1 ）在设置窗口的图像类型下拉菜单中选择“百万种彩色”。2 ）单击“预视”按钮即可看到预扫描后的结果。3 ）单击“扫描范围”工具，在预视图中框选出需真正扫描的区域。4 ）如果预视图像偏暗，可将设置窗口中的“彩色校正”选项选中。5 ）设置窗口中的“图像增强”工具可调整图像的质量，从左到右依次为亮度、对比度、曝光量、色调和高光、曲线、滤波器以及其他选项。6 ）设置适当扫描分辨率（参考“扫描灰度图像”）。7 ）单击“扫描”键，开始扫描并将扫描结果输入到图像处理软件中。ScanWizard扫描软件的操作界面非常简洁明了，获取图像非常方便，如果配合图像增强工具的使用，则更能达到事半功倍的效果。

数码相机和传统相机一样，也是由镜头、快门和光圈等部分组成，只不过传统照相机将影像存放到感光胶片上，而数码相机则将影像存储在内存上。利用数码相机获取自然影像和使用传统光学照相机差不多，其主要需解决硬件参数配置、取景和构图、光线运用、镜头参数调整、数据传送等问题。

4.5.3 用数码相机获取图像

常见的图片加工技术手段主要有：（ 1 ）色调调整：修正由于拍摄光线不足、照相机自身结构等原因而产生的偏色现象。（ 2 ）增加锐度：扫描形成的图片通常锐度不够，适当增加图片的锐度，可提高清晰度。（ 3 ）修版：去掉图片中的斑点、瑕疵和修补缺损等。（ 4 ）分辨率转换：根据不同的使用场合，转换成相应的分辨率。（ 5 ）彩色深度转换：在大多数情况下，通常进行高比特颜色深度到低比特颜色深度的转换。例如某图像在扫描时选择的是 24bit 颜色深度（ 224=16777216 色），如果用于显示，则要转换成 8bit 的颜色深度（ 28=256 色）。（ 6 ）颜色模式转换：图像有若干种颜色模式，最常用的是 RGB 彩色模式和 CMYK 彩色模式。如果 RGB 模式图像用于印刷，则要转换成 CMYK 彩色模式。图像处理软件可对图像进行常规处理，例如图像尺寸的放大与缩小、翻转、旋转、亮度调整、对比度调整等；如果采用稍微复杂的特殊算法，还可以生成很多特殊的图像效果，例如水纹涟漪效果、油画效果、扭曲效果等。

4.5.4 图像加工处理过程

4.6 图像处理软件 Photoshop 7.0

4.6.1 Photoshop 7.0概述

Photoshop 7.0是 Adobe 公司开发的，并不断推陈出新的一种功能强大的图像设计和处理软件，集图形创作、文字输出、效果合成、特技处理等诸多功能于一体的绝佳图像处理工具，被形象地称为“图像处理超级魔术师”。 Photoshop 7.0操作界面如图 4-17 所示。基本界面由 4 个部分构成：最上面的部分是菜单条；右面的部分是调色板；左边的部分是工具箱；最下边的一行是状态行。

菜单栏：分 9 类，其中图像菜单涉及图像的颜色、大小等操作，图层涉及到颜色模式、转换等。最有特色地方是滤镜。

工具箱：有 50多种，有些被隐藏。工具选项栏：显示和设置所选工具的各项控制参数。图像窗口：显示、编辑、处理图像的区域，每幅图像都有自己的图像窗口。

浮动面板：能够控制各种工具的参数设置，完成选择颜色、图像编辑等功能。

状态栏：提供一些当前操作的帮助信息

1 ．新建文件选择命令“文件 /新建”，调出“新建”文件对话框，在此对话框中

可以设置文件的名称、文件的大小、色彩模式等。2 ．打开文件选择命令“文件 /打开”，调出Windows 标准的“打开”对话框。双击 Photoshop 7.0界面中的空白部分，同样可以调出文件打开对

话框，也可以使用快捷键 Ctrl+O 直接打开“打开”对话框。可以一次打开多个文件。3 ．存储文件（ 1 ）“保存”。在编辑文件时因一些意外、死机、程序非法操作、

断电等会造成文件的丢失，所以经常存盘是一个好习惯。选择“文件 /|保存”菜单。（ 2 ）“另存为”。在编辑文件的过程中，如果要想存储该图像又

不想覆盖掉原来的文件，就可以使用“文件 /另存为”命令。。

4.6.2 图像文件操作

4.6.3 基本编辑操作1 ．基本工具的使用 Photoshop 7.0 工具箱如图 4-18 所示。

1) 选取工具 : 矩形选取、套索、魔棒、移动、剪切等

2 ）绘图工具：画笔工具、铅笔工具、橡皮擦工具、背景色橡皮擦工具、魔术橡皮擦工具、渐变工具、油漆桶工具。

3 ）修图工具：仿制图章工具、图案图章工具、修复画笔工具、修补工具、模糊工具、锐化工具、涂抹工具、减淡工具、加深工具、海绵工具。

4) 其他工具：裁切工具、注释工具、语音注释工具、度量工具、抓手工具。

2 ．图层图层是 Photoshop非常重要的一个工具，也是制作精致效果所必不可少的工具，除了最下面的背景图层外，还可以为图像添加数个图层。图层之间的关系可以理解为一张张相互叠加的透明纸，能够根据需要在这张“纸”上添加、删除构成要素或对其中的某一层进行编辑而不影响其他图层，也可以说我们可以对每个图层进行独立的编辑、修改。选择“窗口 /显示图层”命令或者单击键盘上的 F7键，可以将图层面板显示出来。如图 4-19 所示为图层面板结构。

图 4-19 图层面板结构

（ 1 ）图层的基本操作。新建图层：单击图层面板下方的“创建新的图层”按钮。复制图层：在图层面板中直接将选中的图层拖到图层面板下方“创建新的图层”按钮上，或者选择图层面板弹出菜单中的“复制图层”命令。删除图层：选择需要删除的图层，直接拖到面板上的“删除图层”按钮处，或者选择面板弹出菜单中的“删除图层”命令。

调整图层的顺序：图层的叠放顺序会直接影响图像显示的效果。上面的图层总是会遮盖下面的图层，可以通过图层面板来改变图层的顺序。首先选取要移动的图层，执行“图层 /排列”命令，从弹出的子菜单选择一个命令执行，或者使用鼠标直接在图层面板拖动来改变图层的顺序。链接图层：图层的链接命令使我们可以同时对同一图像的多个图层进行旋转和自由变形等操作以及对不相邻图层进行合并。打开一张分层的图像，在图层面板上选中某层作为当前层所要链接层前面的方框，当出现链接图标时，表示链接图层与当前作用层链接在一起了。合并图层：在一幅图像中，图层越多文件尺寸也越大。因此我们可以将一些基本上不用改动的图层或一些影响不大的图层合并在一起，以减少磁盘的使用空间，提高操作效率。选择要合并的图层，在图层面板右侧的下拉菜单中选择合并方式，其中提供了 3 种合并图层的方式，即“向下合并”、“合并可见图层”和“拼合图层”。

（ 2 ）图层的混合模式。色彩混合模式是将当前选定的图层与下面的图层进行混合，从而产生另外一种图像显示效果。当两个图层重叠时，默认状态为“正常”。图层混合模式面板如图 4-20 所示。（ 3 ）使用图层样式。在 Photoshop 中，我们可以针对图层使用多种图层特效。执行“图层 /样式”命令，或单击图层面板底部的图层样式按钮，再从弹出的下拉菜单中选择一种图层样式，如图 4-21 所示为图层样式面板。

图 4-20 图层混合模式图 4-21 图层样式面板

3 ．通道通道用来存储不同类型信息的灰度图像。其次，通道还可以用来存放选区和蒙板，让用户以更复杂的方法操作和控制图像的特定部分。打开一幅图像即会自动创建颜色信息通道。如果图像有多个图层，则每个图层都有自身的一套颜色通道。通道的数量取决于图像的模式，与图层的多少无关。图 4-22 为一幅 RGB 颜色模式的图像 4 个默认通道和两个 Alpha 通道。默认通道为红色（ R ）、绿色（ G ）、蓝色（ B ）各一个通道，它们分别包含了此图像红色、绿色、蓝色的全部信息。另外一个默认通道为 RGB 复合通道，改变 RGB 中的任一个通道的颜色数据，都会马上反映到复合通道中。在操作中，我们可以创建 Alpha 通道，将选区存储为 8 位灰度图像放入通道面板中，用来处理、隔离和保护图像的特定部分。

4 ．蒙板可以利用“蒙板”隔绝出一个受保护的区域，只允许对未被遮挡的区域进行修改。

蒙板效果即是遮照物（即蒙板）作用于被遮照物（即作用图层），遮照物是以 8 位灰度通道形式存储，其中：黑色的部分——完全不透明，被遮照物不可见。白色的部分——完全透明，被遮照物可见。灰度的部分——半透明，被遮照物隐约可见。

图 4-23 蒙板效果图

例 4-3 ：图像的合成。（ 1 ）执行“新建 /打开”命

令，打开如图 4-24 所示的背景图片，将以这幅图片为背景加入各种动物的图片。（ 2 ）打开如图 4-25 所示的

海鸥图片，由于图片的边缘比较明显，可选择工具箱中的“磁性索套工具”，在图像中沿着海鸥的边缘选取整个海鸥区域。为了柔化选区，执行“选择 /羽化”命令，在弹出的羽化对话框中，将羽化值设为 10 ，然后使用快捷键 Ctrl+C 复制选区。

图 4-24 背景图片

图 4-25 海鸥图片

图 4-26 变换后的图片效果

（ 3 ）回到背景图片，使用快捷键 Ctrl+V将海鸥粘贴到背景图片中，这时，系统将自动生成“图层 1” 以放置海鸥图片。执行“编辑 /变换”命令，调整海鸥图片在背景图像中的比例，调整后的效果如图 4-26所示。（ 4 ）打开如图 4-27 所示的海豚图片，运用处理海鸥图片时的方法选取并复制海豚区域，选择后将其复制到背景图片中，系统同样会自动生成“图层 2”来放置海豚图片。

图 4-27 海豚图片

（ 5 ）执行“编辑 /变换 /缩放”命令，调整海豚图片在背景图片中的比例，这时的图像效果如图 4-28所示。选择工具条中的“移动工具”将海豚图片移动到合适的位置，这样的完成了操作。

图 4-28 改变比例

例 4-4 ：蒙板的使用。（ 1 ）执行“新建 /打开”命令，打开如图 4-29 所示的背景图片。

图 4-29 背景图片

（ 2 ）单击图层面板中的“创建新的图层”按钮，新建一个图层，按键盘上的 D 键将前景色设为黑色，用“油漆桶工具”，将图层1 填充为黑色，如图 4-30 所示。

图 4-30 将图层 1 填充为黑色

（ 3 ）选择“椭圆选框工具”，在图层 1 中画一个椭圆，如图 4-31 所示。

图 4-31 在图层 1 中画一个椭圆（ 4 ）单击菜单栏中的“选择 /反选”命令，然后再单击菜单栏中的“选择 /羽化”命令，将羽化值设为 50 ，如图 4-32 所示。然后单击“好”按钮完成羽化操作。

图 4-32 将羽化值设为 50

（ 5 ）单击图层面板下方的“添加图层蒙板”按钮，完成操作，如图 4-33 所示。

图 4-33 完成操作后的效果

4.6.4 高级编辑操作1 ．色彩调整色彩校正主要是对图像进行细微调整，改

变图像的对比度和色彩等。在“图像 /调整”命令的下拉菜单下，提供了一系列命令来帮助调整图像色调和色彩平衡。色彩调整菜单如图 4-34所示。

“色阶”命令：允许通过调整图像的明暗度来改变图像的明暗反差及反差效果，调整图像的色调范围和色彩平衡。

“自动色阶”命令：用来调整图像的明暗度。

“自动对比度”命令：可以自动调节整幅图像亮部和暗部的对比度。

“自动颜色”命令：可以让系统自动对图像进行颜色校正，如图像有色偏或是饱和度过高，均可以使用该命令进行自动调整。

“曲线”命令：也是用来调整图像的整个色调范围，但“曲线”命令调节更为精确、细致，可以调整灰阶曲线中的任何一点，而色阶命令只能调整亮部、暗部和中间灰度。

图 4-34 色彩调整菜单命令

“色彩平衡”命令：可以进行一般性的色彩校正，简单快捷地调整图像颜色构成，并混合各色彩达到平衡。 “亮度 /对比度”命令：用来调整图像的亮度和对比度，只能很简单、直观地对图像做较粗略的调整。“色相 /饱和度”命令：主要用于改变图像像素的色相、饱和度和明度，而且还可以通过给像素定义新的色相和饱和度，实现给灰度图像上色的功能，或创作单色调效果。“去色”命令：能够去除图像中的饱和色彩，将图像中所有颜色的饱和度都变为 0 ，使之转变为灰度图像。“替换颜色”命令：能让用户围绕要替换的颜色创建一个暂时的蒙板，并用其他颜色替换所选颜色。“可选颜色”命令：可以调整颜色的平衡，使用该命令可以有选择性的在图像某一主色调成份中增加或减少印刷颜色的含量，而不影响该印刷色在其他主色调中的表现，从而对图像的颜色进行调整。“通道混合器”命令：利用此命令可以混合当前通道中的像素与其他颜色通道中的像素，以此来改变主通道的颜色，创建一些其他颜色调整工具不易做到的效果。

“渐变映射”命令：主要功能为将预设的几种渐变模式作用于图像，可以自动根据图像中的灰阶数值来填充所选取的渐变颜色。“反相”命令：利用此命令可以反转图像的颜色和色调，将一张正片转换为负片。“色调均化”命令：可以重新分配图像像素的亮度值，使它们能更均匀地表现所有的亮度级别。“阈值”命令：可以将一张灰度图像或彩色图像转变为高对比度的黑白图像。“色调分离”命令：让用户为图像的每个颜色通道定制亮度级别，只要在色阶中输入想要的色阶数，就可以将像素以最接近的色阶显示出来。色阶数越大则颜色的变化越细腻，色调分离的效果不是很明显；相反，色阶数越少效果越明显。“变化”命令：使用户在调整图像、选取范围或图层的色彩平衡、对比度和饱和度的同时，很容易的在预览图像或选取调整前和调整后的缩略图，使调节更为精确、方便。

2．路径路径是绘制矢量图形的工具，如图 4-35 所示。路径是连接锚点与锚点的线段或曲线。利用路径工具可以绘制出各种形状，路径工具提供了一种有效的方式来精确的选取外框。路径可以存储在路径面板中，可将其转化为选取范围，然后对选择区域填色、描边或执行编辑操作。

图 4-35 绘制矢量图形工具

3 ．滤镜滤镜主要用来处理图像的各种效果。

图 4-36 滤镜菜单

“风格化”滤镜：通过置换像素并查找和增加图像中的对比度，在选区上产生如同印象派或其他画派般的作画风格。“画笔描边”滤镜：该滤镜使用不同的画笔和油墨笔触效果产生绘画式或精美艺术的视觉效果。使用该滤镜可以为图像增加颗粒、绘画、杂色、边缘细节或纹理，以得到点画法的效果。“模糊”滤镜：可以平衡图像中已定义线条和遮蔽区域的清晰边缘旁边的像素，使变化显得柔和。“扭曲”滤镜：主要用来产生各种不同的扭曲效果，从水滴形成的波纹到水面的漩涡效果都可以处理。

“锐化”滤镜：主要功能是增加图形的对比度，使画面达到清晰的效果，此滤镜通常用于增强扫描图像的轮廓。“视频”滤镜：用来处理视频图像，将视频图像转换成为图像输出到录像带上。“素描”滤镜：此滤镜使用前景色和背景色重绘图像，产生徒手速写或其他的绘画效果，其中共有 14 种滤镜。“纹理”滤镜：为图像创造某种特殊的纹理或材质效果，增加组织结构的外观。“像素化”滤镜：利用此滤镜可以将图像先分解成许多小块，然后进行重组，因此处理过后的图像外观像是由许多碎片拼凑而成的。“渲染”滤镜：主要功能用于图形着色以及明亮化作用，有些滤镜则用于造景。该滤镜可以对图像产生云彩、分层云彩、纤维、镜头光晕和光照等效果。“艺术效果”滤镜：共包括 15 种滤镜，可以对图像进行各种艺术处理。这些滤镜模仿天然或传统的媒体效果，“艺术效果”滤镜必须在 RGB 模式下使用。“杂色”滤镜：将杂色与周围像素混合起来，使之不太明显。也可以用来在图像中添加粒状纹理。

例 4-6 ：制作空心字。（ 1 ）新建一个 400×200 像素的文件。（ 2 ）选择“文字工具”，在图像的中间部位单击，输入文字，如photoshop ，如图 4-37 所示。

图 4-37 在图像的中间部位输入 photoshop

（ 3 ）在“图层”面板中，在按住 Ctrl键的同时，单击图层面板中的文字图层，获取文字对应的选区。（ 4 ）激活“路径”控制面板，单击面板下方的按钮，从文字对应的选区创建一个新的路径，此时的路径是沿着文字的边缘建立的。

（ 5 ）选择“图层”面板中的文字图层，单击右键，在弹出的菜单中单击“删除图层”选项，删除文字图层。此时图像中只剩下路径，它的外形就是刚刚输入的文字，如图 4-38 所示。

图 4-38 删除文字图层

（ 6 ）选择“画笔工具”，设置一个较细小的画笔，然后单击“路径面板”下方的“用画笔描边路径”按钮，将文字轮廓用选定的画笔描边，效果如图 4-39 所示，空心字就做好了。

图 4-39 将文字轮廓用选定的画笔描边后的效果

例 4-7 ：制作塑料字效果。（ 1 ）新建一个 16cm×8cm的 RGB文件。在“通道”面板中单击“创建新通道”按钮，创建一个新通道 Alpha 1 ，并将其选中，如图 4-40 所示。

图 4-40 创建一个新通道 Alpha 1

（ 2 ）单击工具箱中的“文字工具”，设字体大小为 120 ，字体为 Comic Sans MS ，加粗，然后在页面中单击鼠标输入文字，文字输完后按 Ctrl+Enter键，并将文字调整到页面中的适当位置。注意在操作过程中要保持文字的选取不被取消，如图 4-41所示。

图 4-41 在页面中输入文字

（ 3 ）执行菜单“滤镜 /模糊 /高斯模糊”命令，在弹出的“高斯模糊”对话框中设置半径为 8 ，然后对该命令重复执行3 次，分别设半径为6 、 3 、 1 ，如图4-42 所示。

图 4-42 重复执行 3 次“高斯模糊”后的效果图

（ 4 ）单击图层面板中的“创建新的图层”按钮，在工具箱中设置前景色为浅蓝色（ R:103、 G:150、B:187 ），按 Alt+Del键将文字填充为淡蓝色，如图 4-43 所示。

图 4-43 将文字填充为淡蓝色

（ 5 ）执行菜单“滤镜 /渲染 /光照效果”，在弹出的“光照效果”对话框中，设置“光照类型”为“平行光”，在“纹理通道”中选择 Alpha 1 ，如图 4-44 所示。

图 4-44 在“光照效果”对话框中设置有关选项后的效果图

（ 6 ）执行菜单“滤镜 /模糊 /高斯模糊”命令，在弹出的“高斯模糊”对话框中设置半径为 1 ，使文字表面更加光滑。（ 7 ）执行菜单“滤镜 /艺术效

果 /塑料包装”命令，在弹出的“塑料包装”对话框中设置其“高光强度”为 20 ，“细节”为 15 ，平滑度为 10 ，如图 4-45 所示。

图 4-45 在“塑料包装”对话框中设置有关选项后的效果图

图 4-45 在“塑料包装”对话框中设置有关选项后的效果图

（ 8 ）复制图层 1 ，系统会将复制的图层命名为“图层 1 副本”，将该图层的混合模式改为“叠加”。（ 9 ）在图层面板中选中“图层 1 副本”，单击右上角的三角形按钮，在其弹出菜单中选择“向下合并”命令。

（ 10 ）选中“图层 1” ，单击图层面板左下角的“添加图层样式”按钮，在弹出的菜单中选择“投影”命令，在弹出的“投影”图层样式菜单中，设置如图 4-46 所示。单击“好”按钮，完成所有操作，如图 4-47 所示。

图 4-46 在“投影”图层样式菜单中设置有关选项

图 4-47 完成所有操作后的效果图

4 ．蒙版与通道

1) 通道 : 保存图像的颜色数据 , 保存蒙版。通道面板及通道操作：将通道作为选区载入；将选区存储为通道；创建新通道。2 ）蒙版：蒙版：也叫遮罩或屏蔽，用来保护被遮蔽的区域不受任何编辑作用的影响。蒙版是一个 8 位灰度图像，可以进行编辑和修改，它本身没有色彩，但有不透明、透明和不同程度半透明 3 种状态。蒙版中的黑色部分可以遮挡图层中的图像，白色部分露出图像，黑白渐变部分可实现半遮半露的效果。

图层蒙版 : 黑色和灰色能够遮挡 ( 半遮挡 ) 本图层中的图像 ,露出下层的图像 , 白色区域可显示本层图像。

例子 : 建立带图层蒙版的图像

思考题 1

1. 图像有哪些基本属性？2 .什么是色调、饱和度和亮度？3.什么是矢量图？什么是位图？4.什么是真彩色？什么是真彩色图像？5. 简述加色原理和减色原理。6. 为什么数据可以被压缩？7 . 数据冗余有哪些类型？

思考题 2

1. 获取数字图像有哪些途径？2 ． Photoshop 的图层和通道在图像处理过程中有什么作用？3 ． Photoshop 工具箱中的“钢笔工具”主要的用途是什么？它和“选择工具”有什么联系？4. 分别用 RGB、 CMYK 和灰度模式保存图像时，图像文件的大小有何变化？

Documents

第 4 章 静态图像信息处理

第 4 章静态图像信息处理