• 注册
    • 查看作者
    • 脉冲编码调制相关术语

      1 采样和采样频率

      在音频处理时要先把音频的模拟信号变成数字信号,这叫A/D转换。要把音频的模拟信号变成数字信号,就需要采样,或者叫抽样。当要把音频播放出来时则需要把数字信号转换成模拟信号,这叫D/A转换。一秒钟内采样的次数称为采样频率。

      根据Nyquist采样定理,要想重建原始信号,采样频率必须大于信号中最高频率的两倍。采样频率越高,越接近原始信号,但是也加大了运算处理的复杂度。

      人能感受到的频率范围为20HZ–20kHZ,一般音乐的采样频率为44.1kHZ(根据Nyquist采样定理,采样频率大于信号中最高频率的两倍得出)。更高音乐的采样率可以是48kHZ和96kHZ,不过一般人用耳听感觉不出差别了。

      语音主要是以沟通为主,不需要像音乐那样清晰。语音分窄带和宽带:窄带频率范围为300Hz–3400Hz,对应的采样频率为8000Hz;宽带频率范围为50Hz–7000Hz,相应的采样频率为16000Hz,用16k采样的语音就称为高清语音了。现在主流的语音采样频率为16kHz。其中语音识别技术所使用的采样率基本都是16KHz。

      以下是数字音频最常用的采样率:
      采样率    品质级别    频率范围
      11025Hz    较差的AM电台(低端多媒体)    0~5512Hz
      22050Hz    接近FM电台(高端多媒体)    0~11025Hz
      32000Hz    好于FM电台(标准广播采样率)    0~16000Hz
      44100Hz    CD    0~22050Hz
      48000Hz    标准DVD    0~24000Hz
      96000Hz    蓝光DVD    0~48000Hz

      2 采样位数

      数字信号是用0和1来表示的,采样位数就是采样值用多少位0和1来表示,也叫采样精度。用的位数越多就越接近真实声音。如用8位表示,采样值取值范围就是-128–127,如用16位表示,采样值取值范围就是-32768–32767。

      3 通道数

      通常语音只用一个声道。而对于音乐来说,既可以是单声道(mono),也可以是双声道(即左声道右声道,叫立体声stereo),还可以是多声道,叫环绕立体声,多用于影院中。

      4 比特率

      也叫码率,表示每秒音频数据量的大小。计算公司:比特率=采样率采样精度声道数,单位是kbps。

      5 编解码

      如果把采样值直接保存或者发送,会占用很大的存储空间或者很大的流量。以16kHz采样率16位采样位数单声道为例,一秒钟就有1600016bit1/8bit=32000bytes字节。通常需要把采样后的数字信号压缩后才保存或者发送。把采样值压缩叫编码(encode),形成比特流(bitstream). 把比特流还原出采样值叫解码(decode),统称编解码(codec)。

      通常我们把音频采样过程叫脉冲编码调制编码,即PCM(Pulse Code Modulation)编码,采样值也叫PCM值,为了节省保存空间或者发送流量,会对PCM值压缩。

      6 有损和无损

      根据采样和量化的过程可知,音频编码最多只能做到无限接近自然界的信号,至少目前的技术还不可能将其完全一样。这是因为自然界的信号是连续的,而音频编码后的值是离散的。因此,任何数字音频编码方案都是有损的,这也就意味着任何的音频都不可能完全还原出自然界的声音。

      不过我们常说的有损和无损是指PCM数据压缩(编码)的过程:把PCM数据压缩后无任何损伤叫无损压缩,不过压缩程度不高;把PCM数据压缩后有损伤叫有损压缩,最多可以压到几十分之一,不过音频质量差些。

      美国
    • 5
    • 1
    • 0
    • 41
    • chenyyszkwscylsyxtdr15917501711Mr.FC

      请登录之后再进行评论

      登录
    • 0
      Mr.FCLv.4
      今天又学到新知识了
    • 做任务
    • 偏好设置
    • 实时动态
    • 单栏布局 侧栏位置: