首页技术前沿

汽车音响数字音响技术之声音压缩技术基础
来源:http://www.szaeia.com/    发布时间:2012/11/02   浏览:()次


数据压缩分为有损压缩和无损压缩。无损压缩要求重构的信号和原始信号完全 一致,目前一般无损压缩算法可以将数据压缩原来1/2到1/4。有损压缩适用于重构的信号不一定要和原有信号完全一致,可以将一些不必要的信息德育而不影响对原始数据的判断。
可以通过客观质量度量和主观质量度来判定声音质量的好坏。声音质量客户质量的度量就是对声音的参数进行测量,例如测试声音的信噪比、失真度等。主观质量试题就是通过听觉对声音质量进行评估(见表)

 

分数
质量级别
失真级别
5
优(Excellent)
无察觉
4
良(Good)
(刚)察觉但不讨厌
3
中(Fair)
(察觉)有点讨厌
2
差(Poor)
讨厌但不反感
1
劣(Bad)
极讨厌(令人反感)

1.常见的音频压缩方法

        脉冲编码调制(Pulse Code Modulation,PCM)是概念上最简单、理论上最完善、最早研制成功、使用最广泛、数据流量最大的编码体系。PCM方式是法国人A.H.里福斯于1937年发明的,最早广泛应用于通信之中。随着半导体技术的进步,特别是发展到超大规模集成电路阶段后,PCM方式应用于音响领域成为现实。(见图)

PCM为基本技术的数字音响设备的原理方框图
图:PCM为基本技术的数字音响设备的原理方框图
PCM就是将连续的模拟信号经过取样和量化。PCM分为DPCM(差分脉冲编码调制,Differential Pulse Modulation)和ADPCM(自适应差分脉冲编码调制,Adaptive Differential Pulse Code Modulation)。DPCM只对实际采样值和预测采样值之间的差值进行编码,这样可以减少表示每个样本的位数。ADPCM在DPCM基础上加上自适应特性,根据样本自动 地改变量化阶的大小(见图)
图 PCM方式数字音响设备各阶段波形图
2.声音的感知特性
声音感知有三个主要特性:响度、音调和掩蔽效应。
响度就是声音的强弱,也就是声压或者声强,人们将刚好能够被 听到的1kHz的声音信号的强度定义为0dB声强级。当声音刚刚能够被人的耳朵听到,这时的声音强度 为“听阈”,听阈是随着声音的频率变化而变化的。当声音强到使人的耳朵感到疼痛时,这时的声音强度为“痛阈”,1kHz信号声音强度达到120dB时,人的耳朵就会感觉疼痛。在听阈和痛阈之间的范围就是人耳的听觉范围。
音调也叫音高,用频率来度量。人耳在频率感觉上也有一个范围,测量音高是用1kHz的信号40dB声强为基准。主观测试时,固定的基准声强,用1kHz先听音,然后调节频率使听音者感觉频率变化。音高和频率 之间不是线性关系(见图)
图 音高-频率曲线
图 音高-频率曲线
掩蔽效应是指一个声音A的听觉感受受到另一个声音B的影响。A称为被掩蔽音,B被称为掩蔽音。A单独存在时的听阈强度为绝对听阈,在掩蔽效应下,必须加大A的强度刚刚被听到时的运单强度 为相对听阈。掩蔽效应分为频域掩蔽,时域掩蔽又分为超前掩蔽和滞后掩蔽。
频域掩蔽,是指人耳在一定的频率范围内对同时发出的声音,一个声音很容易就能够掩盖另一个声音,而且频率越接近越容易掩盖,频率向着高频方向越高越不容易掩蔽。
在时间上相邻的声音之间也会发生掩蔽,即时域掩蔽。这是因为人的大脑在处理信息时需要时间的原因,一般来说超前掩蔽需要2ms~5ms,滞后掩蔽可能持续100ms。
3.MPEG音频编码与解码(见图)
图 MPEG 音频编码器的基本结构
MPEG 音频编码器基本结构
MPEG音频解码器结构图

 

MPEG音频解码器结构图
表1 MPEG音频 标准一般达到 的压缩率
层次
压缩率
立体声信号所对应的比特率
1:4
384
1:6~1:8
256~192
1:10~1:12
128~112
 

 表2 MPEG-1 LAYERⅢ在各种音质下的性能

音质要求
带宽(kHz
模式
比特率(kb/s
压缩比
电话
2.5
单声道
8
96:1
优于短波
4.5
单声道
16
48:1
优于调幅广播
7.5
单声道
32
24:1
类似于条幅广播
11
立体声
56~64
26~24:1
接近CD
15
立体声
96
16:1
CD
>15
立体声
112~128
12~10:1
表3 MPEG音频标准各层编码解码器延迟时间

延迟时间
理论最小值(ms
实际实现中的一般值(ms
层1(LayerⅠ)
19
<50
层2(LayerⅡ)
35
100
层3(LayerⅢ)
59
150

文章摘自:姜卫忠《汽车多媒体导航系统蓝皮书》由汽车电子http://www.szaeia.com/整理








友情链接