您的位置 首页 分销

根据STM32的嵌入式语音辨认模块规划完成

介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以

介绍了一种以ARM为中心的嵌入式语音辨认模块的规划与完结。模块的中心处理单元选用ST公司的根据ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话办理单元为中心,通过以LD3320芯片为中心的硬件单元完结语音辨认功用,选用嵌入式操作体系μC/OS-II来完结一致的使命调度和外围设备办理。通过很多的试验数据验证,本文规划的语音辨认模块具有高实时性、高辨认率、高稳定性的长处。

服务机器人以服务为意图,因而人们需求一种更便利、更天然、愈加人性化的方法与机器人交互,而不再满足于杂乱的键盘和按钮操作。根据听觉的人机交互是该范畴的一个重要开展方向。现在干流的语音辨认技能是根据核算形式。但是,因为核算模型练习算法杂乱,运算量大,一般由工控机、PC机或笔记原本完结,这无疑约束了它的运用。嵌入式语音交互已成为现在研讨的抢手课题。

嵌入式语音辨认体系和PC机的语音辨认体系比较,尽管其运算速度和内存容量有必定约束,但它具有体积小、功耗低、可靠性高、投入小、装置灵敏等长处,特别适用于智能家居、机器人及消费电子等范畴。

模块全体计划及架构

语音辨认的基本原理如图1所示。语音辨认包含两个阶段:练习和辨认。不管是练习仍是辨认,都必须对输入语音预处理和特征提取。练习阶段所做的具体作业是通过用户输入若干次练习语音,通过预处理和特征提取后得到特征矢量参数,终究通过特征建模到达树立练习语音的参阅模型库的意图。而辨认阶段所做的首要作业是将输入语音的特征矢量参数和参阅模型库中的参阅模型进行相似性衡量比较,然后把相似性最高的输入特征矢量作为辨认成果输出。这样,终究就到达了语音辨认的意图。

现有的语音辨认技能依照辨认目标能够分为特定人辨认和非特定人辨认。特定人辨认是指辨认目标为专门的人,非特定人辨认是指辨认目标是针对大多数用户,一般需求收集多个人的语音进行录音和练习,通过学习,到达较高的辨认率。

根据现有技能开发嵌入式语音交互体系,现在首要有两种方法:一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。榜首种方法程序量大,核算杂乱,需求占用很多的处理器资源,开发周期长;第二种方法相对简略,只需求重视语音芯片的接口部分与微处理器相连,结构简略,建立便利,微处理器的核算担负大大下降,增强了可靠性,缩短了开发周期。

语音辨认技能在国内外的开展十分迅速。现在国内在PC应用范畴,具有代表性的有:科大讯飞的InterReco2.0、中科形式辨认的Pattek ASR3.0、捷通华声的jASRv5.5;在嵌入式应用范畴,具有代表性的有:凌阳的SPCE061A、ICRoute的LD332X、上海华镇电子的WS-117。

本文的语音辨认计划是以嵌入式微处理器为中心,外围加非特定人语音辨认芯片及相关电路构成。语音辨认芯片选用%&&&&&%Route公司的LD33 20芯片。

硬件电路规划

如图2所示,硬件电路首要包含主控中心部分和语音辨认部分。语音进入语音辨认部分后,将处理过的数据并行传输到主控制器,主控制器通过处理后,发送指令数据到USART,USART可用于扩展外围串行设备,如语音组成模块等。

主控制器电路

本文的主控制器选用的是ST公司的STM32F103C8T6芯片。该芯片根据ARM Cottex-M3 32位的RISC内核,作业频率最高可达72 MHz,内置高速存储器(64 KB的闪存和20 KB的SRAM),丰厚的增强I/O端口和联接到两条APB总线的外设。STM32系列供给了全新的32位产品选项,结合了高功能、实时、低功耗、低电压等特性,一起坚持了高集成度和易于开发的优势,将32位MCU国际的功能和成效引向一个新的等级。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/bandaoti/fenxiao/197223.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部