非特定人语音辨认技能研讨的终究意图是让计算机等设备能够“听懂”人类语音,提取出语音中所包含的特定信息,成为人机通讯和交互最快捷的手法。因为语音信号自身具有不确定性、动态性和连续性,这就为精确量化和处理该信号带来非常大的困难,每个人的语音要树立不同的语音样本也为辨认的遍及带来瓶颈束缚。现在的语音辨认是先树立特征库然后将待辨认的信号经处理与特征库比对得到类似成果断定输出。从本质上归于根据计算办法的基本理论,分言语模型练习、辨认剖析两个大阶段构成和完结。
体系规划的全体结构
体系以STM32F103C8T6 微操控器为操控中心,调配微操控器最小中心电路、LD3320语音辨认电路、SD卡电路、电源电路、用户按键输入电路、串口数据输出电路、状况指示电路等归纳组成。该体系体积细巧,能够作为嵌入式组件单元融入用户电路或许板卡中,上电后STM32F108C8T6内部程序进行程序初始化、SD 卡文件体系初始化、LD3320初始化、随后等候辨认音频接纳,辨认完结后输出呼应信息或许解码音频,体系全体结构如图2所示,终究完结积木式功用组件的悉数功用。
微操控中心电路
体系选用ARM Cortex M3内核ST公司的32位高性能单片机STM32F103C8T6 为操控中心,该芯片能够到达72 MHz的作业频率,内置高速存储器(64 KB的闪存和20 KB的SRAM),具有丰厚的I/O口资源和链接到两条APB 总线的外设。包含了12 b 的ADC、通用16 b 的定时器、还包含I2C、SPI、USART、USB、CAN等总线或串行通讯接口,片内资源和扩展接口都非常丰厚,该微操控中心是专门规划于满意高稳定性、低功耗、实时性、高性价比的嵌入式产品使用。该内核芯片能够满意非特定人语音辨认的功用要求,使用相关电路构成STM32F103C8T6 的最小体系,在硬件PCB 中还集成了功用引针输出接口、SD卡接口、USB下载\调试电路,用户按键、电源电路等,中心体系电路图如图3所示,合作其他外围扩展到达功用要求。
非特定人语音辨认电路
本体系中选用%&&&&&% Route公司出产的LD3320非特定人语音辨认芯片,该芯片对错特定人语音辨认的专用芯片,内部现已集成了语音辨认处理器和一些信号调制电路,具有高性能的A/D转换器、D/A转换器、麦克风音频信号输入接口、音频解码输出接口等,用户只需要用软件修改好待辨认的要害词列表,LD3320最大能够支撑 50 条要害词句,把这些列别以字符的办法传送到芯片中,就能够对待辨认的语音信号进行近似度剖析,辨认后输出成果。
LD3320 全体作业电路如图4 所示,总体上能够把电路图分为8个部分,分别是LD3320根底外围电路、电源电路、外部晶体振荡器电路、麦克风信号处理电路、去耦合滤波电路、解码音频去直流成分电路、功用引针输出电路、状况信号指示电路。语音辨认单元关于电源供电电路的要求较高,电路中重视对供电纯净度的要求,由体系中的LDO芯片 LM1117-3.3 V为语音辨认体系供电,加上电感、%&&&&&%为供电进行滤波,RSTB为LD3320复位引脚,连接到主操控器进行复位操控。LD3320支撑并行数据通讯和串行数据通讯,在本体系规划中考虑对主控I/O 资源的占用问题,故而选用串行通讯办法对LD3320 进行数据传送和操控,LD3320 的MD 引脚通过上拉电阻钳位为高电平。SPI总线的SDI、SDO、SDCK和SCS引脚连接到主控芯片对应引脚。INTB为中止信号引脚,遇到辨认成果输出或许是内部音频文件解码完结等状况,该引脚会对应输出电平状况告诉主控。MBS引脚作为麦克风偏置电压输入,连接了RC电路,确保发生一个起浮电压供应麦克风信号。
本站网技能修改点评剖析:
遍及语音辨认技能是当时研讨和开展的新趋势,特别是关于非特定人的语音辨认是语音信号范畴处理的热门和难点,使用了STM32F103C8T6与 LD3320结合,合作各种外围电路完结了非特定人语音辨认的嵌入式渠道,在渠道中通过硬件构建,在不更改主操控芯片程序的前提下,用户能够通过更改 SD 卡内配置文件的办法随意设定辨认要害句子,通过不同发音人和环境的实测,该体系在喧闹环境中的辨认精确率可达81%,在安静环境中的辨认精确率可达90% 以上,能够便利的嵌入用户体系或许板卡中,积木式建立灵敏有用,因此具有广泛的市场需求和使用远景。
我们如有问题,欢迎在评论处评论。
——本站网收拾,转载请注明出处!