语音交互体系是比较人性化的人机操作界面,它需求语音辨认体系的支撑。而语音辨认技能在这其间起到国家栋梁的效果,它也被称为主动语音辨认,其方针是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或许字符序列。
特定人语音辨认技能是根据“要害词语列表”的辨认技能,它是对很多的语音数据(相当于对数千人收集的数万小时的有用声响数据)经语言学家语音模型剖析,树立数学模型,并经过重复练习提取基元语音的细节特征,以及提取各基元间的特征差异,得到在计算概率最优化意义上的各个基元语音特征,最终才由资深工程师将算法以及语音模型转换成硬件芯片并运用在嵌入式体系中。
本文将介绍一款语音辨认芯片——LD3320芯片。LD3320选用的是ASR技能,供给了一种脱离按键、键盘、鼠标、触摸屏等GUI操作方法且根据语音的用户界面VUI(Voice User Interface),使得用户对该体系的操作更简略、快速和天然。跟着高级MCU的不断出现,以MCU为中心的嵌入式语音交互体系会有非常好的运用远景。
作业原理
图1 LD3320和单片机(或嵌入式体系)组成的语音辨认体系原理框图。
在运用过程中,用户只需求把辨认的要害词语以字符串的方式传送进芯片,即能够在下次辨认中当即收效。比方,用户在51等主控MCU的编程中,简略地经过设置芯片的寄存器,把比如“你好”这样的辨认要害词语的内容动态地传入芯片中,芯片就能够辨认所设定的要害词语了。每个要害词语可所以单字、词组、短句或许任何的中文发音的组合。根据LD3320的语音辨认体系能够跟着运用流程,在运行时动态地更改要害词语列表的内容,这样能够用一个体系支撑多种不同的场景,一起也不需求用户作任何的录音练习。
图2 STC10L08XE构成的主控芯片
图3 LD3320A构成的语音辨认主体系
由图可知,由LD3320组成的语音辨认体系硬件有单片机(或嵌入式体系)及LD33202.图2和图3分别是由单片机STC10L08XE 构成的主控芯片和由LD3320A 构成的语音辨认主体系。
LD3320评价板(其间,操控MCU选用的是STC的51单片机)
编者结语
编者以为这种语音辨认体系首要运用于语音操控的点歌体系、语音操控的手机、音控智能导航仪、音控智能家电产品等。当然,这种语音辨认体系不是完美的,它简单引起误辨认,如当用户说的内容不在辨认列表内时,必定会引起误辨认。为了战胜这些缺陷,下降误辨认率,可在设定好要辨认的要害词语后,再增加一些与辨认列表内的单词有联络的恣意其他词汇,用来吸收过错辨认,然后到达下降误辨认率的意图。