一般在谈到关于DSP解码与体系全体功用体现时,咱们首要运用了传统的SNR、瞬时差错和相位差错等办法进行判别。本文以心思-声学紧缩规划的办法来调查DSP解码的功用与体现,介绍了根据心思-声学的音频紧缩解码概念,并给出了根据心思-声学的DSP功用剖析。
从上个世纪90年代以来,数字信号处理技能便逐渐在消费音频商场占有重要位置。数字信号处理器开始首要用于处理数字化的模仿音频信号,即PCM数据的处理。在当时的体系规划年代,根据具有灵敏软件规划特性的DSP体系规划计划是传统规划的抱负代替办法。
在音频体系的规划中,一般在信号源进行紧缩编码时选用心思-声学模型去除信号中的冗余数据,经过挑选适宜位数的DSP能够确保体系的功用。实践运用中DSP的挑选需求涉及到许多要素,包含精度(24位/32位)、主频、本钱和内存容量等。本文就音频解码运用中,根据心思-声学模型对DSP的功用进行了剖析。
DSP分贝与声压分贝的联系
本文在后面所述的数据都是在dBFS下的丈量值,即满刻度分贝值。从可闻度来剖析,需求将这些数值与dB SPL相关起来,即转化为声压强度的分贝数。在DSP之后的模仿信号链上包含DAC、前置放大器、功率放大器和扬声器,尽管关于不同的体系,每个元件的增益和功用或许会有显着的差异,但单纯从体系装备的视点而言,仍或许把dBFS与dB SPL以满意的准确性相关起来。
一般,数字音轨以-20dBFS电平进行录音,彻底满意信号峰值所要到达的幅值,一起也具有满意的动态规模以展示音频文件的静音部分,在CD、Dolby Digital和DTS等不同格局下也不会失真。众所周知, THX引荐的听觉装备是在85dB声压强度下再现-20dBFS声响信号,这时音量一般会很大,而正常的收听时会比该强度低许多。
从上面是的实际得出dBFS与dB SPL之间是线性映射的,具有以下联系:0dBFS的信号可在105dB SPL再现,需求留意的是这种状况下发生的声响十分高,不适合长期收听; 0dB SPL对应与-105dBFS。
听觉与听觉阈值
人类的听觉是有极限的,一般在声压强度的规划上会把0dB设定为最低可听规模水平。声响频谱中的大部分(300Hz以下和10KHz以上)只要在10dB的声压强度之上才干够听到,正弦波的最高敏感度在3~4KHz,而且这样的声响在-3~-4的dB SPL就能够被听力极好的人感知。
从生理学上看,要到达声响听觉阈值,其能量需求大到能在人的耳鼓发生一个驻波,从而使那儿的纤细毛发发生动摇。没有这种动摇,衔接听觉皮层的神经元就不能被触发,因而声响不能被感知。从上面的评论咱们得到的关于音频体系规划的启示,即当噪音的水平低于人们的听觉阈值时,一味寻求高精度的DSP完成计划并没有实践意义。
运用从前得到的听力装备联系,最低的可听声压为-4dB SPL,即-109dBFS。假定在信号链一切其它部分(DAC、前置放大器等)均为零失真,这就意味着任何能够发生好于109dB信噪比的DSP都不会成为体系功用的瓶颈,这是选用DSP完成体系规划的一个很重要的问题。实践运用中,模仿信号链是体系中噪音的最首要来历,而DSP对噪音的奉献远远低于这些模仿器材。
满意体系功用的DSP位数
上面的剖析是建立在-20dBFS平均水平和THX听力装备状况下。尽管这是一个极限状况,考虑到dBFS/dB SPL转化联系的改变,在规划时还要留出一些功用余量。因而,一个考虑周全的规划应该使DSP的位数比理论位数大约多出两位,即121dB运用6dB/位的装备,对应着PCM输出的20位动态规模。
以上的剖析与杜比公司的Dolby Digital规划计划的假定共同,该计划相同是选用20位的精度。一起,实践的ADC/DAC也约束在20位精度的功用(<120dB),即使是DAT录音也是选用20位的精度。一切的这些都验证了上面的剖析的正确性。
上述数据是根据最坏的状况,由于在实践状况下功率放大器、前置放大器和DAC发生的噪音量比DSP的功用对体系全体的功用影响更大。最好的功率放大器也只是能取得109dB的信噪比,由于噪音能量在线性区域中可累加,这意味着一个输出是121dB的20位DSP,只是会发生放大器6.66%的噪音。而假如扬声器的功用也作为考虑要素,那么DSP发生的噪音便是1/6??扬声器失真,这是能够彻底疏忽的。
上面的剖析乃至没有考虑编码的失真、ADC或麦克风发生的噪音,一切这些都是十分要害的。假如一切信号链都考虑到,很显然20位的DSP现已满意用。只是用十分态正弦波测验,人为的组成精度逾越20位的信号才干得到可丈量的不同,而且这种不同实践上是人类听觉不能感知的。
带有“通明”音频质量的有损紧缩
心思-声学紧缩规划是针对给定信号的有损紧缩,从而了解在什么程度下不同的频域/时域信号是可听见或听不见,以便相应调整编码进程,使引进的噪音降到听觉阈值之下。底子的现象为信号中强音部分会掩蔽接近弱音部分,抱负的状况下,这样的数据削减不会导致感觉到音质的丢失,这样就引出“通明”音频编码或紧缩的概念。
这与简略的SNR丈量有底子的不同,一起更为杂乱,由于它需求准确再现特别信号中相关的可听部分。换句话说,尽管SNR是不错确实定编/解码质量的原则,但它却不适宜用这个规范去断定能够发生-140dB THD+N的DSP就必定比-130dB THD+N的好。由于心思-声学紧缩规划是建立在人类听觉阈值曲线根底之上,上面的定论也就变得十分显着,在这个阈值之下的信号不能被听见。
关于取得“通明”音频紧缩的问题
实践的编/解码输出质量的决定要素有如下几点:
1. 运用的算法
2. 紧缩的比特率
3. 剖析输入信号中用到的心思-声学模型
4. 瞬时剖析架构与转化滤波器组
5. 位分配战略
在完成编码/解码进程中,上述的要素均与算法精度无关,即使是运用无量精度完成,上面的要素相同对音频质量起决定性影响。
根据上面评论的有损紧缩体系,能够得出下面的定论:传统的SNR、THD+N、瞬态差错和相位差错等丈量办法,在比较不同完成计划的功用时都不再是终究的衡量规范,只能在判定和校验体系功用时作为参阅,不能用来对与心思-声学验证的约120dB功用的阈值有纤细的不同的体系进行评级。
DSP增值主张
一般20位DSP现已能满意体系,而从心思-声学视点16位就已满意,关于一个给定的紧缩计划而言,一旦解码器到达了必定的功用,单纯添加DSP的精度就不会进一步的前进体系功用。实践的DSP增值处理计划就变成了对解码音频程序的后期处理和它所供给的体系级特性。实际上,终究顾客还需求产品具有更多的附加特性,例如主动监测、过错屏蔽和具有供给虚拟音效的后期处理器等。
单从商场反映来看,选用32位DSP在概念上仍是很成功,由于从数字上能够直观感觉到功用的前进。实践上,从全体功用和更多功用上来考虑是一种显着的误解,这种误解就相当于对PC机只比较CPU的主频,而不考虑体系的全体功用相同。
32位的DSP并不能真实有助于前进体系终究功用,它需求更大的内存(比24位DSP多出大约33%)。一起,由于32×32MAC比24×24MAC慢,一个32位DSP核将一直比相应的24位核的解码器慢。就信噪比而言,实践运用作用证明,经过优化处理,24位DSP能够得到和32位DSP相同(乃至更高)的功用。
需求留意的是,上面评论只是根据底子的解码器,32位DSP在后期处理上依然存在某些优势。因而,假如前端运用高度优化的24位DSP解码引擎,后端处理器为一个32位DSP,这样一个优化的规划结合了两者的优势是一种不错的挑选,现在现已有这样的体系级芯片计划供给。
本文小结
在实际国际中运用心思-声学来紧缩编码时,SNR测验办法在比较体系功用上并不是适宜的规范。而ITU PEAQ测验渠道办规律更适合丈量可感知音频的质量。此外,当咱们在评价一个DSP处理计划时,还需求考虑到体系的过错屏蔽、主动检测和后期处理的特性,以及体系的发动呼应时刻和批量推迟等。
影响AV接纳体系解码器质量的要素并不满是DSP精度的问题。经过较强的DSP算法技巧和优化,能使一个24位精度的功用逾越32位DSP。但是,跟着制作工艺的不断前进,32位的DSP将终究处理上述问题,使32位的解码器更具本钱和技能上的比较优势。