您的位置 首页 产品

多带鼓励语音编码SA5.0C-BPDF材料的完成

多带激励语音编码SA5.0C-BPDF资料的实现-虽然现在已经有光纤通信等大容量通信手段,但是,在移动通信、卫星通信、军事通信中,节省带宽仍然非常重要。传统的PCM等占用大量信道带宽的语音编码技术,已远远不能满足现代数字通信的需要。欧美、日本等国一直在努力通过降低语音编码速率来扩大通信系统的容量。在我国,对低速率语音编码技术也有迫切的需要,如保密通信、短波信道、水声信道等对码率要求严格的应用场合。但现有语音编码的国际标准传输速率都较高(一般在8 Kb/s以上),而现有的一些低速率语音编码方案的话音质量又不尽人意。因此,如何有效地降低编码速率将一直是重要的研究课题。多带激励语音声码器(MultiBand Excited,MBE)在2.4~4.8 Kb/s速率上能合成出音质比传统声码器好得多的语音,而且具有较好的自然度和容忍环境噪声的能力,是目前这一速率范围内比较理想的

尽管现在现已有光纤通讯等大容量通讯手法,可是,在移动通讯、卫星通讯、军事通讯中,节约带宽依然非常重要。传统的PCM等占用很多信道带宽的语音编码技能,已远远不能满意现代数字通讯的需求。欧美、日本等国一直在尽力经过下降语音编码速率来扩展通讯体系的容量。在我国,对低速率语音编码技能也有火急的需求,如保密通讯、短波信道、水声信道等对码率要求严厉的使用场合。但现有语音编码的国际标准传输速率都较高(一般在8 Kb/s以上),而现有的一些低速率语音编码方案的话音质量又不尽人意。因而,怎么有效地下降编码速率将一直是重要的研讨课题。多带鼓励语音声码器(MulTIBand Excited,MBE)在2.4~4.8 Kb/s速率上能组成出音质比传统声码器好得多的语音,并且具有较好的天然度和忍受环境噪声的才能,是现在这一速率范围内比较抱负的参数编码方案。

1 MBE编码(语音剖析)

1.1 MBE模型

美国MIT大学林肯实验室1988年提出了多带鼓励(MBE)语音编码方案。

MBE语音模型如图1所示,把鼓励频谱分红许多互不交迭的频带,对每一频带别离进行二元清、浊音判定,这便是多带鼓励的由来。这样就答应特定语音帧的鼓励信号可所以周期能量(浊音)和噪声能量(清音)的混合,在必定程度上增加了模仿鼓励的自由度,因而使MBE语音模型能发生高质量的语音,并且使MBE语音模型有更强的抗背景噪声才能。

多带鼓励语音编码SA5.0C-BPDF材料的完成

1.2参数提取算法

MBE语音模型主要参数包含:基音周期;各谐波带清浊音判定信息;各谐波对应谱包络起伏。

依照MBE算法原理图(图2),参数提取算法的完成分为如下四个进程:

(1)基音周期粗估

基音周期的粗估选用在时域内进行的办法。因为实践核算中证明,频域中核算量特别大,并不好用。为处理这一问题,本文选用时域自相关函数来估量基音周期的办法,这个办法的核算量比频域法少得多,但只能在基音周期的整数点值上进行。MBE算法便是对每一帧语音信号,在基音周期预估值范围内(一般在P=20~147之间),核算差错函数Ep(P),使差错函数最小的频率值P便是基音估量的粗估值P1。差错函数:

(2)基音周期细查找

基音周期的细查找选用在频域内进行的办法,能够进一步在频域范围内进行非整数基音周期的估量,然后进步基音周期估量的精度。即在粗估基音P1邻域内进行细查找,确认更精确的基音周期候选值Pt:P1-9/8,P1-7/8,…,P1+7/8,P1+9/8。经过上述算法,能够得到真实基音周期P0。

(3)谐波带清浊音判定(U/V判定)

研讨证明,清音带与浊音带不会频频替换,而是保持着必定的接连性,这样在编码速率较低时,能够将相邻的几个谐波频带区分在一起,一起进行清浊音判定。本文将相邻的3个谐频带区分在一起,整个频带选用最多分红12个带的办法进行清浊判定。判定阈值选用自适应值,假如拟合差错小于阈值,判为浊音,不然判为清音。

(4)谱起伏估量

确认U/V后,就能够对各谐波的包络起伏做终究的确认:

2 MBE解码(语音组成)

多带鼓励模型语音组成的办法大体分为两类,即频域组成法与时域组成法。频域组成法先用收到的参数构成重建语音谱,然后使用傅里叶反改换得到时域序列,相当于剖析进程的逆进程。这种办法比较直接,但不能确保组成语音基音周期的滑润改变,特别当帧长比较长的时分会发生基音周期跳变,使组成语音不天然。时域组成法能使用插值完成帧与帧之间基音周期滑润过渡,组成出更天然的语音。因而在实践的MBE算法中都选用这种办法。如图3所示,浊音Sv(n)与清音SU(n)是分隔组成的,终究将他们相加,构成完好的组成语音SR(n)。

本文关于浊音部分的语音选用时域组成法,因为该办法可使用插值完成帧与帧之间基音周期的滑润过渡,组成出更天然的语音。而关于清音部分的语音,选用频域短时傅里叶改换法组成,因为带通滤波器在频域中易于完成,用FFT完成,核算复杂度更低。

3静音检测

3.1概念

研讨标明,人们在电话沟通时,单向通话的时刻一般只占总的通讯时刻的40%或更少,其他约60%的时刻为倾听对方说话和通讯中静默期。静默期的参数(背景噪声参数)比较简略,用很少的比特数即可表明。假如能精确地判别出语音/静音帧,在静音期间,只发送很少的比特数,从理论上来看,语音编码率应该能够下降50%左右。

静音检测,又称端点检测(Voice AcTIvaTIon DetecTIon,VAD),其意图是从声响信号流里辨认长时刻的静音期(背景噪声),使得在不下降事务质量的情况下到达节约带宽资源的作用。

3.2算法

本文选用了“根据熵的VAD检测法”。熵VAD检测办法是经过对信号幅值散布概率的核算取对数,以得到熵值。假如语音的幅值的绝对值在1.0左右改变,则不能核算出所希望的概率。为了便于核算核算,因而在处理16位的语音文件时,不能将其归一化处理,而是经过预处理,使其起伏值散布在[-50,+50]之间。核算前10~20帧信号的熵值的平均值,乘以某个倍数作为阈值。然后将每一帧的熵值与阈值比较,大于阈值,则VAD=1,不然置0。当VAD=1,暂时记为语音的开始点,假如向后接连几帧都判为1,则该点为起始点,不然从头向后查找。完毕点的查找办法与开始点相同,只不过是向前查找罢了。

4仿真实验

4.1算法完成的全体流程图

前面现已具体阐明晰语音帧的编解码进程与算法,关于参加静音检测模块的全体算法流程图(图4),现在简略阐明本文选用的静音帧的编解码办法:

(1)静音帧编码

当VAD检测成果为0时,为下降编码率,静音帧只发送该静音帧的起伏均。

(2)静音帧的解码

在解码端,若VAD判定为0时,即当时帧为静音帧,则生成一均值为0,方差为1的相似白噪声的随机序列u(n),再与编码端发送的静音帧的起伏均值相乘得到自适应的白噪声序列。

4.2实验成果

原始语音与组成语音时域波形图比较,如图5所示。原始语音与组成语音频谱图比较,如图6所示。

4.3成果剖析

仿真成果标明,根据VAD检测的MBE模型声码器关于语音信号能够很好区域分出语音帧和静音帧。一起,选用VAD检测算法后,关于被检测出的语音帧履行MBE编解码处理,静音帧只传送帧起伏均值,有效地下降了语音编码速率,关于正常语速的通话,本文的编码率能够在本来的基础上削减50%左右。从听觉作用上来看,选用VAD检测的MBE算法的组成语音与未选用VAD检测的一般MBE算法的组成语音几乎没有差异,两种办法有较好的片面听觉作用和可懂度。

5结语

(1)组成波形失真

从仿真实验成果的波形图中能够看出,组成语音波形相关于原始语音波形有一些失真,这与信号处理前的高通滤波器和基音周期粗估前的低通滤波器的规划有关。因为高通滤波器可使输入信号抗工频(50~60 Hz)搅扰,低通滤波器可削减高频共振峰和外来高频噪声对基音周期提取的影响。因而,滤波器的规划在MBE编码中至关重要,这也便是下步工作中首要处理的问题。

(2)基音粗估后参加基音滑润模块,进步基音精确度、滑润语音

因为噪声的搅扰,形成基音周期粗估值的错锁(一般是1/2倍频或1/3倍频),而基音细查找只在基音粗估值的邻近进行,这就使得基音频率以及帧之间有很大跳变,组成语音有停顿感。因而,在基音粗估后参加基音滑润模块,有利于提取基音频率较高时的基音周期,又不至于影响提取基音周期频率较低时的基音周期;它既能确保基音周期的正确估量,又能确保基音演化的滑润性,终究得到音质好的组成语音。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/xinpin/chanpin/102577.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部