第 6 章 动画、视频数据技术

Preview:

DESCRIPTION

第 6 章 动画、视频数据技术. 学习目标 了解模拟视频信号的特点及数字化的基本方法 ; 理解数字电视的基本原理; 掌握数字视频的格式。. 计算机动画和视频源自于静态的图类,将静态的图转变动态画的关键是画的量变和形变。只要将一系列形态差异的画,在人眼中按序经过时,人脑中就会产生动态的感觉。所以动画和视频的创建也必须要考虑符合人类的视觉基本特征和视觉心理特性。纯动画和视频作品一般还需要考虑其他媒体元素的加盟,由此带来的问题是如何实现多媒体之间的巧妙配合和超大数据量的存取。而如何显示动画数据,则取决于显示技术,目前的显示方式主要是模拟视频和数字视频。. - PowerPoint PPT Presentation

Citation preview

第 6 章 动画、视频数据技术学习目标 学习目标 了解模拟视频信号的特点及数字化的基本方法了解模拟视频信号的特点及数字化的基本方法 ;; 理解数字电视的基本原理;理解数字电视的基本原理; 掌握数字视频的格式。掌握数字视频的格式。

计算机动画和视频源自于静态的图类,将静态的图转变动态画的关键是画的量变和形变。只要将一系列形态差异的画,在人眼中按序经过时,人脑中就会产生动态的感觉。所以动画和视频的创建也必须要考虑符合人类的视觉基本特征和视觉心理特性。纯动画和视频作品一般还需要考虑其他媒体元素的加盟,由此带来的问题是如何实现多媒体之间的巧妙配合和超大数据量的存取。而如何显示动画数据,则取决于显示技术,目前的显示方式主要是模拟视频和数字视频。

6.1 动画基础什么是动画?动画大师诺曼 . 麦克拉伦( Norman Mclaren )解释说,动画不是“会动的画”的艺术,而是“画出来的运动”的艺术。6.1.1 动画原理动画是由一系列静态画面,快速按序显示而成。人眼看到的任何物体,即使它马上消失了,它仍然在人的视觉中会停留约 1/24 秒钟,这就是人眼所产生的视觉暂留现象,如果当一幅画还没有完全在视觉中消失前就立即播放出下一幅画,两幅画就自然联系起来,就会给人一种流畅的视觉变化效果,人脑中产生的便是物体在动态。因此,电影标准中规定了每秒 24 幀画面的播放速度,其原因也就显而易见了。

就动画的画面来讲,所表现的动作并非真实的,而是凭想象设计出来的。从动画的制作来讲,动画画面是逐幅绘制的,动画影像也是用电影胶片或像带以逐幅记录的方式制作的。在动画的制作过程中,重要的是不仅要设计好每张画面,同时要考虑物体运动的各种因素,包括物体运动的轨迹、方向,以及所需的时间。为了显示物体连续变化的效果,要求上一幅画面和下一幅画面之间的形态变化不能太大。传统的模拟动画的制作需要一个完整的制作班子,包括原作、脚本、总监督、作画监督、 美术监督、摄影监督、音响监督、演出、人物设定、机械设定、设计稿、原画、作监、背景、动画、动检、色指定、描上、总校、拍摄、编集和配音。而数字动画的制作在时间和质量上都是令人称道的。通过计算机的各种多媒体软件可方便且快速地完成角色的创建,然后利用动画编辑软件实现动画脚本的制作。 

6.1.2 动画类型动画有许多种类,可从不同的角度将其分类。按动画制作技术和手段可分为手工绘制和计算机动画。按照计算机动画实现的方式可分为帧动画和造型动画。按动作的表现形式可分为“完善动画”和简化的“局限动画”。按空间视觉效果可分为二维动画和三维动画。按播放进行方式可分为顺序动画和交互动画。本节主要讨论计算机实现方法和空间视觉效果。

帧动画和造型动画帧动画( Frame )由图形或画像序列构成,序列中的每幅静态图像称为一个“帧”。帧动画可以分为逐帧动画和补间动画。在逐帧动画中,每一个帧上都有可编辑的角色对象,设计者可以分别进行修改。而在补间动画中,只需要设计者在一个表演时间段的两端分别给出两个角色对象,表示运动物体的初始和终结状态画面,动画制作软件就可通过一定的算法计算并生成自然、平滑的中间帧,从而产生细腻的动画效果。

造型动画( Object)也被称为对象动画。造型就是利用三维软件创造三维形体。建立复杂的形体有三种造型技术: 1 组合技术:先要绘出基本的几何形体,再将它们变成需要的形状,然后通过不同的方法将它们组合在一起。2 拓展技术:先创造出二维轮廓,再将其拓展到三维空间。3 放样技术:先创造出一系列二维轮廓,用来定义形体的骨架,再将几何表面附于其上,从而建立立体图形。制作造型动画时,首先要分别对动画中的每个对象进行特征设计,然后再由这些具有个性化的对象组成完整的动画画面。经过特征设计的对象,必须按照一定的要求经过实时转换后才能形成连续的动画。在电影特技中,为了得到比较真实的感觉,虚拟角色的造型可以通过基于物理的动画,例如真实演员可以身带与计算机相连的传感设备(如传感衣、传感手套等)去完成一系列动作,这些动作通过计算机软件接收后就可作为虚拟角色的动作造型。

因此,完成动画至少绘图、造型、动画三个步步骤,动画就是使各种造型运动起来,制作人员所要做的是定义关键帧或对象造型,动画的中间态交给计算机去计算完成。

二维动画和三维动画二维动画 2D的图像设计只局限于平面,缺乏立体感,对诸如光、影、景深、景浅要求不高,所以制作也比较简单。 三维动画 3D的图像设计强调空间概念,配上真实色彩和 3D虚拟环境,动画效果将显得相当逼真。实质上, 3D动画是基于计算机特殊的 3D动画软件给出的一个虚拟的三维空间,通过创建物体的模型,把模型放在这个虚拟的三维空间,配上灯光效果,然后赋予对象以动态效果和质感效果。从某种角度来说,三维动画的创作有点类似于实际工作中的雕刻,摄影,布景设计及舞台灯光等综合使用,所以在虚拟的三维环境中的工作重点也就是要控制各种组合、光线和三维对象。

6.2 视频基础• 6.2.1 模拟电视信号• 1 .黑白电视信号 模拟视频图像扫描方式有隔行扫描和非隔行扫描之分。 黑白电视和彩色电视都用隔行扫描,而计算机显示图像时一般都采用非隔行扫描 (逐行扫描 )。 非隔行扫描:电子束从显示屏的左上角一行接一行的扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。隔行扫描:电子束扫完第 1 行后回到第 3 行开始的位置接着扫,然后在第 5 、 7 、……行上扫,直到最后一行;奇数行扫完后接着扫偶数行,这样就完成了一帧( frame )的扫描。 隔行扫描的一帧图像由两部分组成:一部分是由奇数行组成,称奇数场;另一部分是由偶数行组成,称为偶数场,两场合起来组成一帧。

• 每秒钟扫描多少行称为行频 fH;每秒钟扫描多少场称为场频 ff;每秒扫描多少帧称帧频 fF。 • 采用隔行扫描 的优点:所占用的信号传输带宽要减少一半 ;• 我国的电视画面传输率是每秒 25 帧、 50 场。 25Hz 的帧频能以最少的信号容量有效地满足人眼的视觉残留特性;隔行扫描使人眼不易觉察出闪烁,同时也解决了信号带宽的问题。• 由于我国的电网频率是 50Hz ,采用 50Hz 的场刷新率可以有效的去掉电网信号的干扰。

2 .彩色电视信号 黑白电视只传送一个反映景物亮度的电信号就行了,而彩色电视除了传送亮度信号以外还要传送色度信号。 为使电视台发射一种彩色电视信号,黑白和彩色电视都能正常工作,黑白电视与彩色电视的兼容是个重要问题。

实现黑白和彩色信号兼容:1. 必须使亮度和色度信号分开传送,以便使黑白电视和彩色电视能够分别重现黑白和彩色图像;2.应尽量压缩彩色电视信号的频带宽度,使其与黑白电视信号的带宽相同;3.除了新设置的色同步信号以外,应采用与黑白电视信号完全一致的行、场扫描以及消隐、同步等控制信号。

采用 YUV 空间还可以充分利用人眼对亮度细节敏感而对彩色细节迟钝的视觉特性,大大压缩色度信号的带宽。我国规定的亮度信号带宽为 6MHz ,而色度信号 U 、 V 的带宽分别仅为 1.3MHz 。

在现代彩色电视系统中,通常采用 YUV 彩色空间或 YIQ彩色空间,Y为亮度信号,它可以与黑白全电视信号兼容,而 U、 V是色差信号。

• 为了解决信号频带的兼容问题,还必须采用间插的方法把两个 1.3MHz的色度信号频谱插在亮度信号频谱的高端,这是因为亮度信号的频谱高端信号较弱,而且间隔较大。这样既不增加 6MHz 的带宽,又不会引起亮度和色度信号的混乱。这种方式称为频谱的交错。• 为了与声音载频相区分,一般称色信号在亮度信号频谱高端的中心位置为彩色副载波或简称为副载波。• 我国彩色电视的副载波频率为 4.43MHz 。色度 C信号的总带宽为 2.6MHz ,可以保证色度信号频谱都落在亮度带宽之内,如图。

对于数字电子多媒体领域来说,我们经常接触到的色彩空间的概念,主要是 RGB , YUV 这两种(实际上,这两种体系包含了许多种具体的颜色表达方式和模型,如 sRGB, Adobe RGB, YUV422, YUV420 … ) , RGB是按三基色加光系统的原理来描述颜色,而 YUV 则是按照 亮度,色差的原理来描述颜色。 对于 YUV 模型,实际上很多时候,我们是把它和 YIQ / YCrCb模型混为一谈的。实际上 ,YUV 模型用于 PAL 制式的电视系统, Y表示亮度, UV并非任何单词的缩写。 YIQ模型与 YUV 模型类似,用于 NTSC制式的电视系统。YIQ 颜色空间中的 I和 Q分量相当于将 YUV 空间中的 UV 分量做了一个 33 度的旋转。 YCbCr颜色空间是由 YUV颜色空间派生的一种颜色空间,主要用于数字电视系统中。从 RGB到 YCbCr 的转换中,输入、输出都是 8位二进制格式。

6.2.2 动态视频的颜色空间

UV / CbCr 信号实际上就是蓝色差信号和红色差信号,进而言之,实际上一定程度上间接的代表了蓝色和红色的强度 我们在数字电子多媒体领域所谈到的 YUV 格式,实际上准确的说,是以 YcrCb色彩空间模型为基础的具有多种存储格式的一类颜色模型的家族(包括 YUV444 / YUV422 / YUV420 / YUV420P等等)。并不是传统意义上用于 PAL制模拟电视的 YUV 模型。这些 YUV模型的区别主要在于 UV 数据的采样方式和存储方式,这里就不详述。 YUV 编码只占用极少的带宽( RGB要求三个独立的视频信号同时传输),可以优化彩色视频信号的传输。由于亮度信号是单独传输的,所以可兼容黑白电视。

在视频播放设备、投影机、电视机和其他显示设备中,通常有复合视频、 S-Video 和分量视频 3种接口。复合视频信号 : NTSC和 PAL彩色视频信号是这样构成的 -- 首先有一个基本的黑白视频信号,然后在每个水平同步脉冲之后,加入一个颜色脉冲和一个亮度信号。因为彩色信号是由多种数据“叠加”起来的,故称之为“复合视频”。从全电视信号中分离出伴音后的视频信号,这时的色度信号还是间插在亮度信号的高端。由于复合视频的亮度和色度是间插在一起的,在信号重放时很难恢复完全一致的色彩。这种信号一般可通过电缆输入或输出到家用录像机上,其信号带宽较窄,一般只有水平 240线左右的分分辨率。

分量视频 : 指的是亮度 Y 、色差 U 和 V 分别是 3 路模拟信号,它们通过 3 路导线传送并记录在模拟磁带的 3路磁迹上。分量视频由于其具有很宽的频带,可以提供最高质量及最精确的色彩重放。

S –Video: 则是一种信号质量高的视频接口,它取消了信号叠加的方法,可有效避免一些无谓的质量损失。它的 功能是将 RGB三原色和亮度进行分离处理 , 把亮度和色度信号分成两路独立的模拟信号,用两路导线分别传输并可以分别记录在模拟磁带的两路磁迹上。 。 S-Video 是一种两分量的视频信号,它将两个色差信号U、 V合并的彩色信号C,并以 Y/C格式进行记录。这种信号不仅其亮度和色度都具有较宽的带宽,而且由于亮度和色度分开传输,可以减少其互相干扰,水平分解率可达 420 线,它的特点是信号质量较高。RGB: 许多显示设备中都使用了红( R)、绿( G)、蓝( B)三原色图像,利用 RGB三原色的信号强度来记录和表述图像信息。计算机与显示设备连接也使用 RGB接口,其中通过 RGB三根信号线分别传输图像信号。

6.2.3 彩色空间变换由于许多广播标准,如欧洲的 PAL和北美的 NTSC电视系统,都采用亮度和色差视频信号。因此需要一种机制进行不同色彩格式间的转换,这也称为色彩空间变换。为了将彩色图像按亮度和颜色分别处理,就要把RGB空间表示的彩色图像变换到其他彩色空间。目前采用的彩色空间变换有三种: YIQ 、 YUV和 YCrCb。每种变换使用的参数是为了适应某种类型的显示设备。例如, YIQ 用于 NTSC 彩色电视制式, YUV用于 PAL制和 SECAM彩色电视制式,而 YCrCb用于连接在计算机上的显示器。

在 YUV模型中, Y表示亮度, U、 V是构成彩色的两个分量。考虑人的视觉系统和阴极射线管的非线性特性, YUV 和 RGB的对应关系近似换算式如下: Y = 0.299R + 0.587G + 0.114BU = -0.147R - 0.289G + 0.436BV = 0.615R - 0.515G - 0.100B

YIQ与RGB彩色空间变换所对应关系表示如下:Y = 0.299R + 0.587G + 0.114BI = 0.596R - 0.275G - 0.321BQ = 0.212R - 0.523G + 0.311B

用 YUV或 YIQ 模型来表示彩色图像的优点是亮度信号 Y和色差信号UV( 或 IQ) 是相互独立的,可对 Y、 U和 V三种图像信号单独进行编辑和编码。

所以彩色模拟视频采用的是加色(三色叠加)信号,首先要把彩色图像分解为 R、 G、 B三原色。图像的传输信号可以是单色信号和复合信号。单色信号传输即分别传输R、 G、 B三原色信号,同时加上视频同步信号,在接收端合成显示信号。在采用 8位颜色的数字电视系统中,亮度定义为 16至 235 ,色度 Cb和 Cr信号的取值范围为 16至 240,其中 128与 0相等。YCrCb和 RGB色彩空间的转换关系如下:R' = 1.164 (Y-16) + 1.596(Cr -128)G' = 1.164 (Y-16) - 0.813 (Cr -128) - 0.392(Cb-128)B' = 1.164 (Y-16) + 1.596 (Cr-128)其中 R'G'B' 是伽马( Gamma )校正 RGB数值。由于 CRT显示器在信号幅度和输出强度间是非线性关系,通过伽马校正信号可使它们之间的关系转为线性化。

6.2.4 视频显示和格式 电视机和计算机显示器的阴极射线管( CRT),使用 3个电子枪分别产生红、绿和蓝三种波长的光,在彩色显像管上又使用了红、绿、蓝这三种磷光材料发光合成彩色,这样就需要把用 YUV或 YIQ 表示的图像信号转换成用 RGB表示的图像信号才能显示。模拟视频信号模拟视频信号通过光栅扫描的方法显示在屏幕上。通过一定的扫描行数和速度,在屏幕上从上到下进行扫描,从而产生图像的集合信号。动态的视频图像就是连续显示的不同扫描图像。获取模拟视频图像的设备可以是模拟或数字的显示设备。所不同的是,使用数字显示设备时,必须要经过模 / 数转换。模拟视频模拟视频的常用格式有专用格式的 Betacam SP,家用格式的 VHS、 8mm 和 Hi8 等。

Betacam SP :专业格式比其他格式的分辨率更高,而噪声最少,但价格高。VHS:使用 12mm 带宽的录影带。水平解像度为 280- 300 线。因为是 12mm 带宽的录影带,也有人称之为 V12。8mm :也称为 V8 。因为所使用的录影带为 8mm的带宽所致,全名为 Video8简称V8 。水平解像度为 270 线。Hi8 : Hi8与V8 同为使用 8mm 带宽的录影带,但是水平解像度为 400 线。

6.2.5 模拟视频标准模拟视频的标准也称为电视制式电视制式,目前流行的模拟彩色电视有三大制式,即 PAL制、 NTSC制和 SECAM 制。美、日、加拿大等国采用是 NTSC制。德、英、西欧等国采用是 PAL制,我国也采用 PAL制。法、俄等国采用的是 SECAM 制。由于电视频道的带宽是有限的,因此,模拟电视调谐器模拟电视调谐器接收模拟电视信号接收模拟电视信号时,无论是哪一种制式,都要使两个色差信号调制到某个副载波频率上,采用频谱搬移的方法将许多不同频率的高频电视信号变换成一个固定的中将许多不同频率的高频电视信号变换成一个固定的中频输出频输出,然后与 Y信号共频带传送。

NTSC 视频 NTSC(美国国家电视标准委员会, National Television Standards Committee )是 1952年定义的彩色电视广播标准,称为正交平衡调幅制式。 NTSC采用的是 YIQ彩色空间,鉴于人眼难于分辨蓝、品红间的颜色细节和容易分辨红、黄间的颜色细节这个特点,采用蓝、品红间色差信号 Q 和 红、黄间的色差信号 I去代替蓝、红两个色差信号。 NTSC制首先是将 Q 和 I 这两个色差信号(其频率为 3.58MHz 、相位分别为 0° 及 90° 的副载波信号)进行正交平衡调幅,然后将亮度信号 Y和调制后的色度信号混合,再加上复合同步、复合消隐及色同步等辅助信号,结果产生彩色复合全电视信号CVBS去调制发射机,在接收端可利用同步检波的方法恢复这两个色差信号。 NTSCNTSC 标准标准规定视频源每秒钟需要发送 30幅完整的图像,每个帧的总行数只有 525 。为了避免出现严重的闪烁现象,采用隔行扫描法。将每一帧均分为两个场,每场的扫描行数为 262.5行。一部分全是奇数行,另一部分则全是偶数行。显示的时候,先扫描奇数行,再扫描偶数行,就可以有效地改善图像显示的稳定性。所以其帧频为 30Hz ,场扫描频率是 60Hz 。

NTSC彩色电视制式 具有如下的扫描特性:( 1 ) 525 行 /帧, 30 帧 /秒( 29.97fps,33.37ms/frame )。( 2 )高宽比:电视画面的长宽比(电视为 4:3 ;电影为 3:2 ;高清晰度电视为 16:9)。( 3 )隔行扫描:一帧分成 2 场( field), 262.5线 /场。( 4)在每场的开始部分保留 20 扫描线作为控制信息,因此只有 485条线的可视数据。 Laser disc 约 420线, S-VHS 约 320线。( 5 )每行 63.5微秒,水平回扫时间 10微秒(包含 5微秒的水平同步脉冲),所以显示时间是 53.5微秒。( 6 )颜色模型: YIQ。

PAL 视频 PAL(逐行倒相, Phase Alternate Line )是 1962年德国制定的彩色电视广播标准,也称为逐行倒相正交平衡调幅制。 PAL制式采用 YUV颜色模型,它首先是将 U和 V这两个色差信号(其频率为 4.43MHz 、相位分别为 0° 及 ±90°的副载波信号)进行正交平衡调幅,如色差信号V对副载波进行平衡调幅时,一行为 90° ,另一行为 -90° 。 PAL制改善了 NTSC制对于相位的敏感性,从而减小了由于相位变化所引起的色调失真。 根据不同的参数细节, PAL制式还可分为 G、 I 、 D等制式,我国使用 PAL-D制式,该彩色电视制式规定视频源每秒钟需要发送 25 幅完整的图像,每个帧的总行数为 625 ,也采用隔行扫描法,每一场的扫描行数为 312.5行。所以其帧频为 25Hz ,场扫描频率是 50Hz 。

• 扫描特性:• ( 1 ) 625 行(扫描线) /帧, 25 帧 /秒( 40ms/帧)。• ( 2 )高宽比( aspect ratio): 4:3 。• ( 3 )隔行扫描, 2 场 /帧, 312.5 行 /场。• ( 4)颜色模型: YUV 。

SECAM SECAM 视频视频SECAMSECAM (顺序传送彩色与存储 SEquential Couleur Avec Memoire )是法国采用的一种电视制式。 1956 年由法国工程师亨利 . 弗朗斯于提出,并于 1967 年付之实用的兼容性彩色电视制式。SECAM 制式是色差信号对副载波信号进行调频,而两个色差信号R-Y和 B-Y是逐行轮换传送的方式,又称为顺序传送与存储复用调频制。在信号传输过程中,亮度信号每行都传送,而两个色差信号则是逐行依次传送,在接收端可利用延迟线将收到的信号延迟一行,使每一行所传送的色差被使用两次,用来弥补了每行中缺少的另一个色差信号。这种利用行错开传输时间的办法,可以避免同时传输时所产生的串色以及由其造成的彩色失真。SECAM 制式也采用隔行扫描法,其帧频和场频与 PAL-D制式相同。

• 有如下的扫描特性:• ( 1 ) 625 行(扫描线) /帧, 25 帧 /秒( 40ms/帧)。• ( 2 )高宽比: 4:3 。• ( 3 )隔行扫描, 2 场 /帧, 312.5 行 /场。• ( 4)颜色模型: YUV 。

三种电视制式的区别在这三种制式中, NTSCNTSC制式最早研究成功, PAL制式和SECAM 制式分别针对 NTSCNTSC制式的缺点而提出的改进制式。制式的主要区别在于其帧频不同、分辨率不同、信号的带宽不同、可载频率不同或色彩空间的转换关系不同。表 6-1 列出了三种电视制式的主要技术指标。

电视信号数字化 • 常用的方法有两种:• ( 1 )先用高速模 / 数转换器对彩色全电视信号进行数字化,然后在数字域中进行分离亮度和色度,以获得所希望的 YUV( PAL, SECAM 制)分量或 YIQ ( NTSC制)分量,最后转换成 RGB分量数据。此种方法称为复合数字化。• ( 2)从复合彩色电视图像中分离出彩色分量的亮度和色度,得到 YUV或 YIQ分量,然后用 3 个模 / 数转换器对 3个分量分别进行数字化,最后再转换成 RGB空间,此种方法称为分量数字化。

数字视频数字视频( Digital Video-DV)是定义压缩图像和声音数据记录及回放过程的标准。数字视频的特点 影像质量好、音响效果好、设备价格较低、不会导致制作过程的质量损失、不需要视频捕捉卡和帧同步卡,捕捉和录制是实时的。 大部分数码摄像机都能通过 FireWire (IEEE 1394) 接口与计算机相连,可以实时录像并能进行快速的数据传输。

6.3 数字视频6.3.1 数字视频概述

模拟视像设备中的视频信号是模拟信号,如果要将模拟视像设备中的模拟视频信号转变为数字视频信号,就需要通过视频卡的处理。模拟摄像机就是最常见的模拟视像设备,我们要从模拟摄像机中获取数字视频的话,一般是先将视频源影像的颜色和亮度信息转变为电信号,再记录到储存介质。然后经过视频捕捉设备的采样、量化和编码,也就是将模拟视频信号通过 A/D转换器转变为数字的“0”或“1”的过程。计算机的作用作用是控制视频采集卡的实时工作,并将采集获取的数字视频以一定的格式存储在介质上。

数字视频是可以通过软件播放器在计算机上直接进行播放的。但如果要在摄像机、电视机上观看数字视频,则需要一个从 D/A数模转换器将二进制信息解码成模拟信号,才能进行播放。

数字视频编辑数字视频编辑包括利用采集卡将数字化的数据转换成 MPEG或 AVI 文件,还包括可以利用有关软件进行线性编辑或非线性编辑。MPEG文件是经过压缩的,一般不适合再编辑,但也可以利用工具作如添加字幕、配音等简单的编辑。而 AVI 文件比较适合于再编辑,除了可以添加字幕、配音等简单编辑外,还能进行图像叠加和增加特技效果。

在数字视频编辑中,相对于线性编辑来说,非线性编辑更具有特色:1 在非线性编辑软件环境中,可以反复多次对数字视频文件或部分进行编辑和处理。2 非线性编辑系统的实际编辑过程中,只编辑点和特技效果的记录。任何对剪辑的剪切、复制、顺序调动都不影响画面的质量。3 非线性编辑系统可以是硬件,也可以是软件。特点是功能强,集成度高。

数字视频常用格式有关数字视频( DV)的格式要从两个方面来讨论,一是具有 DV 格式的设备,另一方面是数字视频压缩技术。从具有 DV 格式的设备来讲,相关的录像机系列有 D1 、 D2、D3、 D5等标准格式,按其记录方式又分数字分量( D1 、D5 )和数字复合( D2、 D3)。从数字视频压缩技术方面来讲,数字录像机的记录格式分有非压缩和压缩两大类。非压缩记录格式是以原有信号码率(每秒传递的 bit数)直接记录输入信号,所记录的图像质量最高,原信号损失最小。压缩记录格式是有损的记录格式。编码过程中去除了一些较弱的感知信号后重新编码记录。由于数字视频的数据量特别大,通常都采用压缩编码技术。

6.3.2 CCIR标准CCIR标准是有关于广播电视以及有关的通信设备方面的标准。该标准以国际电信组织下属的国际无线电协商委员会( CCIR)命名。 1993年已并入国际电信联盟( ITU)标准中, CCIR标准对应于 ITU标准中的 ITU-R。该标准主要规定了数字地面电视广播的业务复用、传送和识别方法、 HDTV演播信号系统。 CCIR标准的具体内容见表 6-2。

表 6-2 CCIR标准( ITU-R 标准)序号 标准号 相关内容1 M.633-3 406MHz 频段低极地轨道卫星运行的卫星应急位置指示无线电信标(卫星 EPIRB)系统的传输特征2 M.541-9 用于海上移动业务的数字选择性呼叫设备的运行程序3 M.493-11 海上移动业务使用的数字选择性呼叫系统4 M.1678 移动系统的自适应天线5 M.1677 国际摩尔斯电码6 M.1174-2 用于 450 至 470 MHz 之间用于船上通信的设备的技术特征7 BT.1680 应用于剧院环境的大屏幕数字成像分配的基带成像格式8 BT.1368-4 VHF/UHF波段的陆地数字声音广播的规划标准

9 BT.1201-1 超高清晰度成像

10 BS.1679 应用于剧院环境的大屏幕数字成像的音频质量的主观评价

11 BT.655-7 调幅残余边带陆地电视系统受无用模拟视频信号和相关声音信号干扰射频保护比12 BT.1675 最小化广播系统回路延迟干扰的系统设计和操作实践13, BT.1674 广播制作和后期制作的元数据要求14 BT.1300-2 数字地面电视广播的业务复用、传送和识别方法15 , BT.1210-3 主观评定中要使用的测试材料16 BT.1120-5 HDTV演播信号的数字干扰17 BS.1114-

5 ,用于向工作在 30-3 000 MHz 频率范围内的车载、便携和固定接收 机广播的陆地数字声音广播系统

18 BR.602-5 用于节目内容评估的高清晰度电视记录的交换

19 BR.265-9 , 用于电视的电影节目国际交换的操作实践

20 S.580-6 用作运行于静止卫星地球站天线的设计目标的辐射图

6.3.2 数字电视数字电视就是采用数字技术的电视。由于数字电视具有能实现双向交互业务、抗干扰能力强、频率资源利用率高等优点。如今,在交互电视、远程教育、会议电视、电视商务、影视点播等应用中,数字电视提供了优质的电视图像和更多的视频服务。数字电视的基本原理 数字电视的含义含义除了是指数字电视接收机外,还包含了从发送、传输到接收的全过程。由电视台送出的图像及声音信号,经数字压缩和数字调制后,形成数字电视信号,经过无线介质或有线介质传送到数字电视接收机,然后通过数字解调和数字视音频解码处理还原出图像及伴音。

数字演播室数字录像数字特技数字音频

非线编动画制作

视频压缩编码音频压缩编码

系统复用信道编码

数字调制信道传输

视频数据流音频数据流

数字接收机辅助数据条件接收

MPEG-2

与模拟电视系统不同的是,电视节目从摄制、编辑、播送、传输、接收到显示的全过程均采用全数字化的技术处理,信号在整个过程中的损失大大减小,接收到的电视节目质量基本与演播现场水平相同。 数字电视也可以以模拟电视信号为信源,对模拟电视信号经过抽样、量化和编码转换成用二进制数字信号,然后可对数字化后的信号进行记录、存储、处理和传输,还可以用计算机进行处理、监测和控制。

数字电视广播实现技术数字电视广播中,其信号的流程包括制作(编辑)、信号处理、广播(传输)和接收(显示)几个过程。

用于数字节目制作的手段主要有:数字摄像机和数字照像相机、计算机、数字编辑机、数字字幕机;用于数字信号处理的手段有:数字信号处理技术( DSP)、压缩、解压、缩放等技术;用于传输的手段有:地面广播传输、有线电视(或光缆)传输、卫星广播( DSS)及宽带综合业务网( ISDN )、 DVD等;用于接受显示的手段有:阴极射线管显示器( CRT)、液晶显示器、等离子体显示器、投影显示等。

实现数据压缩的技术演播室质量的数字化电视信号的数据率在 200Mbps ,而高清晰度电视,在 1920×1080显示格式下的视频传输码率中高达 995Mbps ,如此高的数据率是无法在模拟电视频道带宽内传输的,因此必须要进行数据压缩。数据压缩可通过压缩信源编解码和信道编码两种技术来实现。1.压缩信源编解码技术包括视频和音频压缩编解码技术。通过视频编码技术将模拟图声信号变为数字信号源,再进行MPEG-2 压缩编码。 MPEG-2支持标准分辨率的 16: 9宽屏及高清晰度电视等多种格式,其码率范围为 3~ 40Mbps 。压缩音、视频的主要任务是去掉信源的音、视频中的信息冗余,提高信源的有效性。

2. 信道编码技术信道编码技术主要采用数字电视信道的编解码及调制解调数字调制技术。目的是提高单位频宽数据传送率,增强数据流的可靠性,对信源编码后的数据包加上附加比特以及其他处理,使得经过信道传输后的数据流即使在受到损伤后,在接收端也能实现误码纠正,恢复出正确的数据。主要的方法是通过纠错编码、网格编码、均衡等技术提高信号的抗干扰能力,通过调制把传输信号放在载波上以便发射。目前各国数字电视所采用的纠错、均衡等技术、带宽、调制方式都是不同的 ,它们的传输途径不同,在信道编码方面分别采用了不同的调制方式。

正交振幅调制( QAM ):调制效率高,要求传送途径的信噪比高,适合有线电视电缆传输。键控移相调制( QPSK ):调制效率高,要求传送途径的信噪比低,适合卫星广播。 残留边带调制( VSB):抗多径(即重影)传播效应好,适合地面广播。编码正交频分调制( COFDM ):抗多径传播效应和同频干扰好,适合地面广播和同频网广播。

数字传输的常用调制方式有:

系统业务复用部分数字电视的信源编码都采用 MPEG-2的复用数据包,数字电视的复用系统是 HDTV的关键部分之一,其特点是具有可扩展性、分级性、交互性。发送信息时,复用器将由编码器送来的视 /音频等数据比特流分成组,经处理复合成单路串行(时分复用)的比特流,送给信道编码及调制。而接收信息的过程正好相反。辅助数据中包括控制数据以及与视频、音频节目有关的服务数据,比如隐藏字幕。条件接收是付费电视的密钥数据,向具有接收授权的用户提供解密信息,允许观看预定的节目。

BACK

数字电视的主要特点1 图像清晰度好,音频质量高,支持 5.1 声道的数字环绕声节目源。而数字信号可通过精确的再生过程重建原始信号,可避免非线性失真的影响,还可以采用纠错编码技术提高电视机的抗噪声、抗干扰能力。2 传输效率高。通过使用先进的信道编码和调制方法,一个频带内可实现多路、多套节目的同时传输。3 数字电路成本低、无需调整和调谐、容易维修。4 提供全新的业务方式。数字电视网、电信网和计算机网的结合,将提供更丰富的信息源、共享方式、交互方式,可扩大用户使用和控制信息使用的自由度。5 便于信号的存储。可以存储多帧的电视信号,而且所用的存储时间与信号的特性无关。6 实现高效的控制。与计算机配合不仅可以实现设备的自动控制和调整,很容易实现加密 / 解密和加扰 / 解扰技术。

数字电视的分类 ( 1 )按信号传输方式分类:可以分为地面无线传输(地面数字电视)、卫星传输(卫星数字电视)、有线传输(有线数字电视)三类。 ( 2)按产品类型分类:可以分为数字电视显示器、数字电视机顶盒、一体化数字电视接收机。 ( 3)按清晰度分类:可以分为普及型数字电视( PDTV)或者低清晰度数字电视( LDTV)、标准清晰度数字电视( SDTV)和高清晰度数字电视( HDTV)。低清晰度数字电视的图像水平清晰度大于 250 线, VCD的图像格式属于低清晰度数字电视( LDTV)水平。标准清晰度数字电视的图像水平清晰度大于 500 线, DVD的图像格式属于标准清晰度数字电视( SDTV)水平。高清晰度数字电视的图像水平清晰度大于 800线。( 4)按显示屏幕幅型分类:可以分为 4 : 3幅型比和 16: 9 幅型比两种类型。

( 5 )按扫描线数(显示格式)分类:可以分为 HDTV扫描线数(大于 1000 线)和 SDTV扫描线数( 600~ 800 线)等。

数字电视的标准

现在国际上的数字电视存在三种标准,第一种是美国的 ATSC标准,第二种是欧洲的 DVB 标准,第三种是日本的 ISDB标准。

1.ATSC标准ATSC( Advanced Television System Committee先进电视制式委员会)是美国高清晰度数字电视联盟制订的包括数字式高清晰度电视( HDTV)在内的先进电视系统的技术标准。ATSC数字电视标准由四个分离的层级组成,最高为图像层,确定图像的形式,包括象素阵列、幅型比和帧频。次高层是图像压缩层,采用 MPEG-2 压缩标准。第三层是系统复用层,特定的数据被纳入不同的压缩包中,采用 MPEG-2 压缩标准。最低是传输层,确定数据传输的调制和信道编码方案。对于地面广播系统,采用 Zenith公司开发的 8-VSB传输模式,在 6MHz地面广播频道上可实现 19.3Mb/s 的传输速率。该标准也包含适合有线电视系统高数据率的 16-VSB传输模式,可在6MHz 有线电视信道中实现 38.6Mb/s 的传输速率。

2.DVB标准DVB( Digital Video Broadcasting 数字视频广播)是包括 DVB数字卫星和有线电视传输系统在内的电视广播系统的统一标准,该标准具有灵活可扩充和移动通信的优势。目前已经作为世界统一的标准被大多数国家接受,包括中国。DVB标准规定数字电视使用统一的 MPEG-2 压缩方法和 MPEG-2传输流及复用方法,其中音频压缩可以有立体声 MUSICAM 、多声道MUSICAM 及 AC-3 等多种选择。还包括提供广播节目的细节信息、统一的 R-S纠错码、统一的加扰系统和条件接收公共接口。 DVB标准也允许选用不同的接收系统。对于不同的传输媒体,可采用不同的调制方法及通道编码纠错方法。目前, DVB已包括以下多个标准:

DVB-S: 用于数字电视卫星直播。它采用 QPSK (四相相移键控)调制,通过减小传输信号频带来提高信道频带利用率,可以将二进制数据变换为多进制 ( 即 N进制 ) 数据来传输。同时使用了 MPEG-2格式,接收端达到 CCIR601演播室质量的码率为 9Mbps ,达到 PAL 质量的码率为5Mbps 。一个 54MHz 转发器传送速率可达 68Mbps ,并可供多套节目复用。DVB-C :用于数字电视有线广播。主要有 16 、 32、 64 QAM (正交幅度调制)三种调制方式,采用 64 QAM ( 64bit正交幅度调制)调制时,一个PAL通道的传送码率为 41.34Mbps ,还可供多套节目复用。DVB-T :用于数字电视地面开路。 MPEG-2数字视音频压缩编码仍然是开路传输的核心。采用 COFDM调制方式, 8M 带宽,可分为 2k和 8k两种载波模式。

3.ISDB标准ISDB( Integrated Services Digital Broadcasting 综合业务数字广播)是日本的 DIBEG( Digital Broadcasting Experts Group 数字广播专家组)制订的数字广播系统标准。ISDB利用一种已经标准化的复用方案在一个普通的传输信道上发送各种不同种类的信号,对于已经复用的信号还可以通过各种不同的传输信道发送出去。 ISDB具有柔软性、扩展性、共通性,便于灵活地集成和发送多节目的电视和其它数据。

6.3.3 高清晰度电视 HDTV什么是高清晰度电视高清晰度电视 HDTV(High Definision TV) 是美国首先提出的,经过八年的技术开发,美国联邦委员会 (FCC) 于 1995年正式确定 HDTV地面广播方式和产品的规格。 1998 年,美国已正式开播数字高清晰度节目。以后在许多其他国家也逐渐开播了数字电视节目。HDTV是数字电视标准中最高级的一种。国际无线电咨询委员会对HDTV系统的定义是 :“ 当观看距离约为屏幕高度的3倍时,该系统能使显像的实际效果等于或接近于由视力正常的观众观看原始景物或表演时所取得的印象。”

高清晰度数字电视建立在数字信号处理、大规模集成电路制造和计算机科学技术的基础上。主要采用了抗干扰性能极强的数字信号传输技术,将显示分辨率提高到 1000 线以上,从而显著地提高了图像的清晰度。接收图像的宽和高之比由原来的 4 : 3增加到 16:9 ,并增加了家庭影院效果的 5.1 声道环绕声,同时消除了传输过程中可能带来的重影和噪声影响。 HDTV的实现的是真正将电影院的视听效果带入到了家庭当中。

高清晰度电视的技术特征在数字电视系统中,决定电视图像清晰度因素有扫描格式、场频和图像格式等。电视系统的扫描方式有逐行方式和隔行方式,模拟电视系统均采用了隔行扫描方式。在 HDTV和 SDTV中,既有隔行扫描方式,也有逐行扫描方式。隔行扫描是一种有效的带宽压缩,它将一帧图像分成两场扫描,在每帧扫描行数及图像换幅频率一定的情况下,可将视频信号带宽降低为逐行扫描的一半,不过,隔行扫描方式有导致图像质量下降的缺陷,例如,会出现行间闪烁现象。逐行扫描没有隔行扫描的缺陷,同时逐行扫描也是计算机显示采用的扫描方式,所以采用逐行扫描有利于在计算机与电视之间实现互操作性。

场频(刷新频率,指屏幕在每秒钟内更新的次数)在模拟电视系统中,选择场频主要考虑了运动图像的连续感、无闪烁、不易受交流电源的干扰和视频信号频带不知过宽等因素,国际上一直采用 50HZ和 60HZ两种场频, 50HZ和 60HZ场频相比,在高亮度情况下,图像会出现闪烁。实验证明,在 HDTV中,如果要在接收端消除大面积闪烁现象,场频必须高于 70-80HZ,60HZ也是不够的。图像格式 包括图像的宽高比、图像的纵横像素数和像素宽高比

VCD属于普及型低清晰度数字电视,只相当于目前的模拟电视,水平清晰度在 300 线上下。 DVD属于标准清晰度数字电视 SDTV,其图像和伴音的质量都高于目前的模拟电视,图像格式有 720×480p ( P为逐行扫描)和 720×525P等,并且其频道利用率高。高清晰度电视具有更高的图像分辨率和清晰度,其图像宽高比有 4:3 和 16:9 两种,如果是 4:3的图像格式,PAL制式为 1408 ×1152, NTSC制式为 1408×1080。如果是 16:9 的图像格式, PAL制式下为 1920×1125 ,而 NTSC制式下为 1920×1080i( I 为隔行扫描)和 1280×720p等格式。实际的广播的模式是由电视台最终确定,但是接收机仍可以选择播放模式。

在数字电视系统中,决定电视图像清晰度的因素有扫描格式、光传感器的质量、记录系统和处理器件的模拟频率宽度、数字系统的取样频率以及电视接收机的质量水平。比如: 1920 ×1080 隔行扫描图像格式,每帧图像为 2073600 像素,每秒传送 30帧共 62208000 像素。 1280 ×720 逐行扫描图像格式,每帧图像为 921600 像素,每秒传送 60帧共 55296000 像素,两种扫描形式传输的像素相差并不太大。隔行扫描格式可以产生较高的静态图像清晰度 , 而逐行扫描格式可以产生较高的瞬时动态图像清晰度。

国际上高清晰度电视( HDTV)及标准清晰度电视( SDTV)的制式有很多种。制式的不同主要是指不同的扫描格式( 525/59.94,625/50,1080/50)等、不同的宽高比要求,如( 4: 3或 16: 9 )、不同的彩色表示方法( YUV或 YIQ )等、不同的数字化方法、不同的取样量化参数及不同的数字信源压缩编码、数字信道编码与数字调制方法等。在 HDTV视频压缩编解码标准方面,各种制式采用了 MPEG-2标准。压缩后的信息可以供计算机处理,也可以在现有和将来的电视广播频道中进行分配。

在音频编码方面,欧洲、日本采用了 MPEG-2标准,美国采纳了杜比公司的 AC-3方案,将 MPEG-2作为备用方案。在 HDTV复用传输标准方面,也都采用了 MPEG-2标准。 HDTV数据包长度是 188个字节,相当于 4 个 ATM信元。如果利用以 ATM为信息传输模式的宽带综合业务数字网,就可用 4个 ATM信元来传送一个HDTV传送包。

那么清晰度是怎么描述的呢?那么清晰度是怎么描述的呢?决定电视的清晰度的重要参数是场频率和视频系统的频带宽度。最大垂直清晰度由垂直扫描总行数所决定。由于隔行扫描会造成局部的并行,所以实际的垂直清晰度还要把有效扫描行数乘以一个 Kell 系数。在 2 : 1 隔行扫描方式中, Kell 系数为 0.7 ,即垂直清晰度为电视有效行数的 0.7倍。水平清晰度定义水平清晰度定义为图像上可以分清的垂直线条数。水平清晰度与图像传感器的像素数和视频系统的频带宽度有直接关系。由于图像的宽高比系数大于 1 ,所以,图像的水平清晰度线数应该是图像上实际能分清的黑白垂直条数除以宽高比系数。电视的水平清晰度的计算公式为电视的水平清晰度的计算公式为:水平清晰度 TVL/ PH = 有效行时间 (μs) ×2 × 频带宽度 (MHz) ÷ 宽高比系数我国电视标准规定行周期(行扫描时间)为 64μs ,有效行时间为 52.2μs ,标称视频带宽为 6 MHz ,所以我国现行电视标准的水平清晰度为:水平清晰度 (SDTV) =52 (μs) ×2 ×6 (MHz) ÷( 4/ 3) = 468 TVL/ PH。

按我国 GB3174 - 82 彩色电视标准,一帧电视画面由 625 行扫描线组成,电视画面的宽高之比是 4∶3,由此可计算出每行应有 833 个像素。实际上,每帧图像的有效行数为 575 行。因此我国现行电视标准的垂直清晰度为 575 ×0. 7 = 403 TVL/ PH。应该指出的是,电视的垂直清晰度是由电视制式决定的,与电视信号的传输和视频带宽无关。

6.4 动画、视频文件格式动画、视频是一种流式媒体,流式媒体格式文件基于宽带技术的视频、音频实时传输技术。通过流媒体服务器还可以把连续的视频、音频信息进行压缩处理,而网络用户可以通过媒体播放器、流媒体下载工具边下载边观看。流媒体文件中常见的有:AVI ( Windows 视频格式)、SWF( Flash 格式)、 MOV( Quick Time 格式)、WMV(微软流媒体格式 ) 、和 RM ( RealMedia 格式)。

使用不同压缩编码的文件格式必定具有不同的特性。特定格式的视频文件必须要有相应的播放软件特定格式的视频文件必须要有相应的播放软件。播放软件的功能首先是能够识别视频文件的格式,其次是能够通过解压来回放数据。因此,播放软件只要包含某种格式的解释和解压功能,就能够播放该种格式的视频文件。如 VFW ( Video for Windows )中的 MediaPlayer就能播放 MOV和 AVI等多种格式的文件。 通过软件或硬件可以在不同视频文件的格式之间进行转换。例如,通过视频采集卡将视频数据存储为 AVI 格式之后,利用视频编辑软件可以对其进行再编辑,并把编辑以后的视频数据存储为 AVI 格式或 MPEG格式。

6.4.1 swf

标准的 swf格式也就是 FLASH影片文件。利用 FLASH软件可以创建 swf格式文件,而 swf格式文件的播放需要特殊的解码器。 swf文件是由文件头和文件体组成,两者都不定长,文件头定义了本 swf文件的版本、是否压缩、文件大小、场景大小、帧率、总帧数共 6个内容,swf文件是利用 Macromedia Flash 制作的,当动画设计完成后,首先应该将作品保存成 fla 格式的文件,便于今后再作修改之用。当要在互联网上发布时,应把它发布为SWF文件。 swf文件的主要特点是体积小、封闭了制作过程。但是使用 Imperator FLA( flash破解工具软件)仍然可以将 SWF文件转换成 FLA文件。

SWF文件发布之前,首先要在 Flash 中使用“文件” /“ 发布设置”命令,进行必要的参数设置,“发布设置”命令对话框中如图6-1 所示: 

图 6-1 Flash 影片的设置

对于音频流和音频事件的参数,可通过“设置”按钮进行设置,可设置的参数包括:压缩音频方式(禁用、 adpcm 、 mp3、原始、语音等)、预处理(转换立体声成单声)、比特率( 8kbps~160kbps )、品质(快速、中、最佳)。

6.4.2 MOV

QuickTime 是 Apple 计算机公司开发的一种音频、视频文件格式,用于保存音频和视频信息,具有先进的视频和音频功能,被包括 Apple Mac OS、 Microsoft Windows 95/98/NT在内的所有主流电脑平台支持。 QuickTime 文件格式支持 25位彩色,支持 RLE 、 JPEG等领先的集成压缩技术,提供 150多种视频效果,并配有提供了 200多种 MIDI兼容音响和设备的声音装置。新版的 QuickTime进一步扩展了原有功能,包含了基于 Internet 应用的关键特性,能够通过 Internet提供实时的数字化信息流、工作流与文件回放功能,此外, QuickTime 还采用了一种称为 QuickTime VR (简作 QTVR) 技术的虚拟现实 (Virtual Reality, VR) 技术,用户通过鼠标或键盘的交互式控制,可以观察某一地点周围 360度的景像,或者从空间任何角度观察某一物体。 QuickTime 以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的高度开放性,得到业界的广泛认可,目前已成为数字媒体软件技术领域的事实上的工业标准。国际标准化组织 (ISO) 最近选择QuickTime 文件格式作为开发 MPEG-4规范的统一数字媒体存储格式。

6.4.3 AVI AVI: AVI( 英文全称是 Audio Video Interleave)播放软件:( Windows Media Player, DivX Player 2.0 Alpha, QuickTime Player,Realone等)1992年初Microsoft公司推出了 AVI 技术及其应用软件VFW ( Video for Windows )。在 AVI 文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。是一种音频视像交插记录的数字视频文件格式。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。

构成一个 AVI文件的主要参数包括视像参数、伴音参数和压缩参数等:视像参数 ( 1 )视窗尺寸( Video size ):根据不同的应用要求,AVI的视窗大小或分辨率可按 4: 3 的比例或随意调整:大到全屏 640×480 ,小到 160×120 甚至更低。窗口越大,视频文件的数据量越大。 ( 2 )帧率( Frames per second):帧率也可以调整,而且与数据量成正比。不同的帧率会产生不同的画面连续效果。伴音参数: 在 AVI文件中,视像和伴音是分别存储的,因此可以把一段视频中的视像与另一段视频中的伴音组合在一起。 AVI 文件与WAV 文件密切相关,因为WAV 文件是 AVI文件中伴音信号的来源。伴音的基本参数也即WAV 文件格式的参数。

除此以外, AVI文件还包括与音频有关的其他参数: 1 、视像与伴音的交织参数( Interlace Audio Every X Frames) AVI格式中每 X帧交织存储的音频信号,也即伴音和视像交替的频率 X是可调参数, X的最小值是一帧,即每个视频帧与音频数据交织组织,这是 CD- ROM 上使用的默认值。交织参数越小,回放 AVI文件时读到内存中的数据流越少,回放越容易连续。因此,如果 AVI文件的存储平台的数据传输率较大,则交错参数可设置得高一些。当 AVI文件存储在硬盘上时,也即从硬盘上读 AVI文件进行播放时,可以使用大一些的交织频率,如几帧,甚至 1秒。 2 、同步控制( Synchronization) 在 AVI文件中,视像和伴音是同步得很好的。但在 MPC中回放 AVI文件时则有可能出现视像和伴音不同步的现象。压缩参数: 在采集原始模拟视频时可以用不压缩的方式,这样可以获得最优秀的图像质量。编辑后应根据应用环境环择合适的压缩参数。

AVI数字视频的特点 AVI及其播放器 VFW已成为了 PC机上最常用的视频数据格式,是由于其具有如下的一些显著特点:( 1 )提供无硬件视频回放功能: AVI格式和 VFW软件虽然是为当前的 MPC设计的,但它也可以不断提高以适应 MPC的发展。根据 AVI格式的参数,其视窗的大小和帧率可以根据播放环境的硬件能力和处理速度进行调整。在低档MPC机上或在网络上播放时, VFW的视窗可以很小,色彩数和帧率可以很低;而在 Pentium级系统上,对于 64K色、 320×240 的压缩视频数据可实现每秒 25 帧的回放速率。这样, VFW就可以适用于不同的硬件平台,使用户可以在普通的 MPC上进行数字视频信息的编辑和重放,而不需要昂贵的专门硬件设备。( 2 )实现同步控制和实时播放:通过同步控制参数, AVI可以通过自调整来适应重放环境,如果 MPC的处理能力不够高,而 AVI文件的数据率又较大,在WINDOWS环境下播放该 AVI文件时,播放器可以通过丢掉某些帧,调整 AVI的实际播放数据率来达到视频、音频同步的效果。

( 3 )可以高效地播放存储在硬盘和光盘上的 AVI文件:由于 AVI数据的交叉存储, VFW播放 AVI数据时只需占用有限的内存空间,因为播放程序可以一边读取硬盘或光盘上的视频数据一边播放,而无需预先把容量很大的视频数据加载到内存中。在播放 AVI视频数据时,只需在指定的时间内访问少量的视频图像和部分音频数据。这种方式不仅可以提高系统的工作效率,同时也可以实现迅速地加载和快速地启动播放程序,减少播放 AVI视频数据时用户的等待时间。( 4)提供了开放的 AVI数字视频文件结构: AVI文件结构不仅解决了音频和视频的同步问题,而且具有通用和开放的特点。它可以在任何Windows环境下工作,而且还具有扩展环境的功能。用户可以开发自己的 AVI视频文件,在Windows环境下可随时调用。 ( 5 ) AVI文件可以再编辑: AVI一般采用帧内有损压缩,可以用一般的视频编辑软件如 Adobe Premiere 或 MediaStudio进行再编辑和处理。AVI格式对视频文件采用的是有损压缩方式,该方式的压缩率较高,并可将音频和视频混合到一起使用,因此尽管画面质量不是太好,但其应用范围仍然非常广泛。支持 256 色和 RLE压缩。 AVI文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影象信息,有时也出现在 Internet上,供用户下载、欣赏新影片的精彩片断。 Microsoft-VIDEO的标准动态影像。windows系统的媒体播放器即可播放 AVI文件。

AVI(n AVI) 如果你发现原来的播放器突然打不开这种格式的 avi文件了,那你就要考虑是不是碰到了 n AVI。 n AVI是 newAVI 的缩写,是一个名为 ShadowRealm 的地下组织发展起来的一种新视频格式。它是由 Microsoft ASF 压缩算法的修改而来的(并不是想象中的 AVI),视频格式追求的无非是压缩率和图象质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率( frame rate )。当然,这是牺牲 ASF 的视频流特性作为代价的。概括来说, NAVI 就是一种去掉视频流特性的改良型 ASF 格式,也可以被视为是非网络版本的 ASF 。

6.4.4 网络视频格式 Microsoft公司推出的 Advanced Streaming Format (ASF,高级流格式 ) ,也是一个在 Internet上实时传播多媒体的技术标准, Microsoft公司的野心很大,希图用 ASF取代QuickTime 之类的技术标准。ASF的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、以及扩展性等。 ASF 应用的主要部件是 NetShow服务器和 NetShow播放器。有独立的编码器将媒体信息编译成 ASF流,然后发送到 NetShow服务器,再由 NetShow服务器将 ASF流发送给网络上的所有 NetShow播放器,从而实现单路广播或多路广播。这和 Real 系统的实时转播则是大同小异。WMV( Windows Media Video )是微软在 ASF基础上推出的一种媒体格式,其特点就是体积小,适合于高速网络传输。通过 Windows Media Encoder编码可以制作 WMV和 ASF文件。

RA/.RM/.RMVB---RealVideo 文件 RealVideo 文件是 RealNetworks公司开发的一种新型流式视频文件格式,它包含在 RealNetworks公司所制定的音频视频压缩规范 RealMedia 中,主要用来在低速率的广域网上实时传输活动视频影像,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现影像数据的实时传送和实时播放。 RealVideo除了可以以普通的视频文件形式播放之外,还可以与RealServer 服务器相配合,在数据传输过程中边下载边播放视频影像,而不必像大多数视频文件那样,必须先下载然后才能播放。目前, Internet上已有不少网站利用 RealVideo 技术进行重大事件的实况转播。 RMVB影片格式比原先的 RM 多了 VB两字,在这里 VB是 VBR( Variable Bit Rate-- 可变比特率)的缩写。在保证了平均采样率的基础上,设定了一般为平均采样率两倍的最大采样率值,在处理较复杂的动态影像时也能得到比较良好的效果,处理一般静止画面时则灵活的转换至较低的采样率,有效的缩减了文件的大小!

MPEG/.MPG/.DAT---MPEG文件 MPEG文件格式是运动图像压缩算法的国际标准,它采用有损压缩方法减少运动图像中的冗余信息,同时保证每秒 30 帧的图像动态刷新率,已被几乎所有的计算机平台共同支持。 MPEG标准包括 MPEG视频、 MPEG音频和 MPEG系统 (视频、音频同步 )三个部分, Video CD (VCD)、 Super VCD (SVCD)、 DVD (Digital Versatile Disk)则是全面采用 MPEG技术所产生出来的新型消费类电子产品。 MPEG压缩标准是针对运动图像而设计的,其基本方法是:在单位时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧发生变化的部分,从而达到压缩的目的,它主要采用两个基本压缩技术:运动补偿技术 (预测编码和插补码 )实现时间上的压缩,变换域 (离散余弦变换 DCT)压缩技术实现空间上的压缩。 MPEG的平均压缩比为 50∶1 ,最高可达 200∶1 ,压缩效率非常高,同时图像和音响的质量也非常好,并且在微机上有统一的标准格式,兼容性相当好。

Recommended