导言
本文介绍的便是一种依据DSP的中文语音组成体系的完成办法。跟着语音信号处理技能的不断发展与老练,语音组成正逐渐成为信息技能中人机接口的关键技能。DSP芯片,即数字信号处理器,是专门为快速完成各种信号处理算法而规划的、具有特别结构的微处理器,其处理速度比最快的CPU还快10~50 倍。
1 体系总体方案
语音组成的最大特色便是要从有限的存储单元中组成出无限字汇的接连句子来[1]。为了做到这一点,本体系规划了由(1)前端预处理模块将输入文本文件转换成体系可以处理的规范格局;(2)韵律规矩库给出当时言语环境下各个音节的韵律特征参数;(3)语音组成器依据给定的韵律特征参数对原始语音库中相应语音单元的声学参数进行调整;(4)将经过调整的各个语音单元拼接在一起,得到相应于输入文本的接连语音输出等4个根本流程组成。体系根本原理框图如图1所示。
2 硬件体系规划
*基金项目:湖南省教育厅(03C025)
该中文语音组成体系的意图是对输入的文本文件可以明晰地、天然地、能懂地以接连语音地办法输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行 显现,再送TMS320VC5402处理,最终将组成成果输出。硬件结构框图如图2所示。
2.1 键盘电路和显现电路
AT89S52的键盘接口电路是选用中止办法的,有键按下时,就发生中止请求,进入中止处理,然后经过查询P1.0和P1.1的状况,进行相应的处理。用电阻和%&&&&&%够成了消抖电路,以避免电路的误操作。
AT89S52把从键盘输入的文本信息送给LCD显现,一起把数据写到外部存储器CY7C133,然后TMS320 VC5402读取CY7C133上的信息进行处理。LCD的指令格局如表1所示:
表1 LCD的指令格局
其间RS, R/W一起决议挑选哪一个寄存器,如表2所示:
表2 寄存器挑选
2.2 TMS320VC5402与AT89S52的通讯
AT89S52和TMS320VC5402各自独立作业,其信息和数据交换经过同享一片外部存储器来完成,它们之间信号联络经过硬衔接和软件判别来完成[2]。
外部存储器选用的是CY7C133,它是高速的2K X 16bit的静态异步双端口RAM,其存储速度为25ns。它有两套独立的地址线、数据线和操控信号线,答应两个操控器材中的数据经过一起衔接的存储器来进行通讯。该双端口RAM答应两个操控器一起读取任何存储单元(包含一起读同一单元),但不答应一起写或许一读一写一致地址单元。
关于TMS320VC5402,数据存储器CY7C133的对应地址为4000H~47FFH。
关于AT89S52,数据存储器CY7C133的对应地址为2000H~27FFH。
3 软件体系规划
汉语作为一种有调言语,其韵律特征非常复杂。为了从有限的存储单元中组成出无限字汇的接连句子来,必须在必定的韵律规矩下对语音库单元的韵律参数进行调整,以得到契合当时语流环境的音变单元[3]。
依据得到音变单元的办法不同,可将语音组成器分红两种类型:(1)波形拼接组成;(2)参数组成(又称源/滤波器组成)。本体系选用波形拼接组成的办法直接对波形的时域和频域波形进行调整以得到所需求的音变单元。
简略的波形拼接法很难进行音高和音长(时刻长度)调整。因而,本体系选用中性语调音节直接拼接合作基音同步波形叠加(PSOLA)算法,并用码鼓励线性猜测(CELP)编码办法对原始采样音库进行编码紧缩的办法。根本流程图如图3所示。
?
4 结束语
本体系使用SCM实时显现输入的文本文件,可以将组成语音和输入文本文件完成比照输出,直观性强;组成算法运算复杂度低,可以用尽量小的音库来完成对容量有限的存储空间的占用程度的要求具有明晰度、能懂度和天然度高。