30
第第第 第第第第第第第第第第 第第第 第第第第第第第第第第

第二章 音频信息的获取与处理

  • Upload
    lan

  • View
    194

  • Download
    0

Embed Size (px)

DESCRIPTION

第二章 音频信息的获取与处理. 考核目的: 考核学生对数字音频获取与处理的基本原理、采样量化的基本原理、音频卡的组成及工作原理、音频编码标准以及音乐合成原理的理解和掌握。. 考核的知识点: 什么是数字音频、数字音频采样和量化的基本原理、音频卡的工作原理、音频编码标准和音乐合成的原理。. 考核要求: 掌握:数字音频信息的获取与处理的原理过程、音频卡的工作原理。 理解:数字音频采样量化的原理过程、音乐合成的原理。 了解:数字音频编码的标准。. - PowerPoint PPT Presentation

Citation preview

Page 1: 第二章 音频信息的获取与处理

第二章 音频信息的获取与处理第二章 音频信息的获取与处理

Page 2: 第二章 音频信息的获取与处理

      考核目的: 考核学生对数字音频获取与处理的基本

原理、采样量化的基本原理、音频卡的组成及工作原理、音频编码标准以及音乐合成原理的理解和掌握。

Page 3: 第二章 音频信息的获取与处理

        考核的知识点:

什么是数字音频、数字音频采样和量化的基本原理、音频卡的工作原理、音频编码标准和音乐合成的原理。

Page 4: 第二章 音频信息的获取与处理

        考核要求: 掌握:数字音频信息的获取与处理的原

理过程、音频卡的工作原理。 理解:数字音频采样量化的原理过程、

音乐合成的原理。 了解:数字音频编码的标准。

Page 5: 第二章 音频信息的获取与处理

2-1 数字音频:在计算机内,所有的信息均以数字表示。各种命令是不同的数字,各种幅度的物理量也是不同的数字。音频信号也用一系列数字表示,称之为数字音频。数字音频的特点是保真度好,动态范围大。(教材 P17 )

Page 6: 第二章 音频信息的获取与处理

2-2 采样:模拟声音在时间上是连续的,而数字音频是一个数字序列,在时间上只能是断续的。因此当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值,称之为采样,采样的时间间隔称为采样周期。(教材 P18 )

Page 7: 第二章 音频信息的获取与处理

2-3 量化:在数字音频技术中,把采样得到的表示声音强弱的模拟电压用数字表示。模拟电压的幅值仍然是连续的,而用数字表示音频幅度时,只能把无穷多个电压幅度用有限个数字表示,即把某一幅度范围内的电压用一个数字表示,这称之为量化。(教材 P18 )

Page 8: 第二章 音频信息的获取与处理

2-4 .常用的音频采样率有: 8kHz 、 11.025kHz 、 22.05kHz 、 16kHz 、 37.8kHz 、 44.1kHz 、 48kHz 。(教材 P18 )

Page 9: 第二章 音频信息的获取与处理

2-5 数字音频的文件格式(教材 P21 ).WAV Microsoft 公司的波形音频文件格式。.MID MIDI 文件格式。.VOC Creative 公司的波形音频文件格式。.SND NeXT 计算机的波形音频文件格式。.AIF Apple 计算机的波形音频文件格式。.RMI Microsoft 公司的 MIDI 文件格式。它可

以包括图片、标记和文本。

Page 10: 第二章 音频信息的获取与处理

2-6 WAV 文件储存容量计算(教材 P19 )WAV 文件的字节数 / 每秒 = 采样频率( H

z ) × 量化位数(位) × 声道数 /8

)()(102410248

)()(MBs

HzS

时间声道数位量化位数采样频率

Page 11: 第二章 音频信息的获取与处理

2-7 MIDI 文件(教材 P20 )由于 MIDI 文件记录的是一系列的计算指令

而不是数据化后的波形数据,因此占用的存储空间比 WAV 文件要小很多。所以预装 MIDI 文件比装入 WAV 文件要容易很多。这为设计多媒体应用系统和指何时播放音乐带来很大的灵活性。但是 MIDI 文件的录制比较复杂,这要学习一些使用 MIDI 创作并改编作品的专业知识,并且还必须有专门工具,如键盘合成器等。

Page 12: 第二章 音频信息的获取与处理

2-8 音频信号处理的特点(教材 P20-21 )(1) 音频信号是时间依赖的连续媒体。(2) 理想的合成声音应是立体声。(3) 对语音信号的处理,要抽取语意等其

它信息,如可能会涉及到语言学、社会学、声学等。

Page 13: 第二章 音频信息的获取与处理

2-9 从人与计算机交互的角度来看音频信号相应的处理(教材 P21 )(1) 人与计算机通信 音频获取;语音识别

与理解。(2) 计算机与人通信 音频合成; 声音定

位;音频 /视频同步。(3) 人—计算机—人通信

Page 14: 第二章 音频信息的获取与处理

2-10 音频卡的主要功能(教材 P21 )音频的录制与播放、编辑与合成、 MIDI接口、文语转换、 CD-ROM接口及游戏接口等。

Page 15: 第二章 音频信息的获取与处理

2-11 音频卡的分类(教材 P23 )音频卡的分类主要根据数据采样量化的位

数来分,通常分为 8 位、 16 位和 32 位等几类。位数越高,量化精度越高,音质就越好。

Page 16: 第二章 音频信息的获取与处理

2-12 音频卡的工作原理(教材 P24-25 )( 1 )声音的合成与处理:这部分是音频

卡的核心,一般由数字声音处理器、 FM音乐合成器及 MIDI控制器组成。

它的主要任务是完成声波信号的 模 / 数、数 / 模转换,利用调频技术控制声音的音调、音色、和幅度。

Page 17: 第二章 音频信息的获取与处理

( 2 )混合信号处理器及功率放大器:内置数字 / 模拟混音器,混音器的声源可以是 MIDI 信号、 CD 音频、线输入、话筒和 PC 的扬声器等,可以选择输入一个声源或将几个不同的声源进行混合录音。

( 3 )计算机总线接口和控制器:总线接口和控制器是由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑及 DMA (直接存储器存取)控制逻辑组成。

Page 18: 第二章 音频信息的获取与处理

2-13 音频卡硬件的安装步骤(教材 P26 )( 1 )将电脑电源关闭,拔下供电电源和所有外接线插头;

( 2 )打开机箱外壳,选择一个空闲的 16 位扩展槽并将声卡插入扩展槽,声卡一般应尽可能远离显示卡,以防两者互相干扰;

( 3 )连接来自 CD-ROM驱动器的音频线及声卡的输入 /输出线和游戏棒等;

( 4 )如果需要,将 CD-ROM驱动器的接口电缆插在卡上相应的接口上,并将 CD-ROM 的音频输出线接到声卡的针形输入线上;

( 5 )连接诸如麦克风、外部音源和游戏棒等其它设备;

( 6 )盖上机箱外壳,并将电源插头插回,待全部调试通过后再将固定螺丝拧紧。

Page 19: 第二章 音频信息的获取与处理

2-14 从信息保持的角度讲 ,只有当信源本身具有冗余度 , 才能对其进行压缩。根据统计分析结果,语音信号存在着多种冗余度,其最主要部分可以分别从时域和频域来考虑。另外由于语音主要是给人听的,所以考虑了人的听觉机理,也能对语音信号实行压缩。 (教材 P28 )

Page 20: 第二章 音频信息的获取与处理

2-15 音频编码的分类(教材 P30 )( 1 )基于音频数据的统计特性进行编码 ,其典型技术是波形编码。

( 2 )基于音频的声学参数,进行参数编码 ,可进一步降低数据率。其目标是使重建音频保持原音频的特性。

( 3 )基于人的听觉特性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心理声学模型,从而实现更高效率的数字音频的压缩。其中以 MPEG标准中的高频编码和 Doldy AC-3最有影响。

Page 21: 第二章 音频信息的获取与处理

音频编码的分类如下:1 ) 基于音频数据的统计特性进行编码典型技术是波形编码: PCM : DPCM

ADPCM

2 )基于音频的声学参数,进行参数编码3 )基于人的听觉特性进行编码

Page 22: 第二章 音频信息的获取与处理

2-16 音频编码算法和标准(教材 P31-36 )

( 1 ) G.711 、 G.721 、 G.722 、 G.728

( 2 ) 5 、 MPEG中的音频编码 ( 3 ) AC-3 编码和解码

Page 23: 第二章 音频信息的获取与处理

2-17 AC-3 编码和解码(教材 P36-39 )

Page 24: 第二章 音频信息的获取与处理

AC-3 可编程解码器 ( P37 )AC-3 编码器框图 ( P37 )AC-3 编码流程图 ( P38 )同步帧结构图 ( P39 )AC-3 解码器框图 ( P40 ) 

Page 25: 第二章 音频信息的获取与处理

2-18 一个乐音,包括必备的三要素:音高、音色和响度。若把一个乐音放在运动的旋律中,它还应具备时值—持续时间。这些要素的理想配合是产生优美动听的旋律的必要条件。(教材 P40 )

Page 26: 第二章 音频信息的获取与处理

  音高:音高指声波的基频。基频越低,给人的 感觉越低沉。音阶与频率的对应关系 ( P41 )

音色:声音的音质。由声音的频谱决定的:各阶谐波的比例不同,随时间衰减的程度不同,音色就不同。

响度:响度是对声音强度的衡量,它是听判乐音的基础。

Page 27: 第二章 音频信息的获取与处理

音乐合成技术的种类     调频 (FM) 音乐合成技术FM 是使高频震荡波的频率按调制信号规律变化的一种调制方式。

音乐系统框图 ( P42 )

Page 28: 第二章 音频信息的获取与处理

        波形表 (Wavetable)音乐合成技术乐器发出的声音进行采样后,将数字音频

信号存储在 ROM芯片或硬盘中,进行合成时将再将相应乐器的波形记录播放出来,即波形表音乐合成技术。

Page 29: 第二章 音频信息的获取与处理

什么时候使用 MIDI?

         长时间高质量音乐        以音乐做背景音响效果,同时从 CD—ROM 中装载其他数据

        以音乐做背景音响效果,同时播放波形音频或实现文语转换,以实现音乐和语音同时输出。

Page 30: 第二章 音频信息的获取与处理

2-19 MIDI规范(教材 P42 )MIDI(Musical Instrument Digital Interf

ace)是乐器数字接口的缩写,泛指数字音乐的国际标准。 MIDI 标准规定了不同厂家的电子乐器与计算机连接的电缆和硬件。它还指定从一个装置传送数据到另一个装置的通信协议。这样,任何电子乐器,只要有处理 MIDI 信息的处理器和适当的硬件接口都能变成 MIDI 装置。MIDI 间靠这个接口传递消息而进行彼此通信。