根据ARM处理器的非特定人语音识别系统规划

0 导言

跟着高新技能在军事范畴的广泛运用，武器装备逐渐向高、精、尖方向开展。传统的军事练习因为练习时刻长、练习费用高、练习空间窄，常常不能到达预期的练习作用，已不能满意现代军事练习的需求。为处理上述问题，模仿练习应运而生。

为进一步进步练习作用，本文使用智能语音交互芯片规划了某模仿练习器的示教与回放体系。示教体系为操作人员生动的演示规范操作流程及相应的操作现象，极大地缩短了对操作人员的练习时刻，进步了练习作用。回放体系经过记载操作练习进程中各操作人员的口令、声响强度、动作、时刻、操作现象等，待操作练习完毕后经过重演练习进程，以便操作者及时纠正自己的问题。示教体系也可理解为对规范操作练习进程的回放。该体系不需求虚拟现实技能的支撑，在小型的嵌入式体系上就可以完结。

1 体系原理

该模仿练习器由一台测控计算机和多台从设备组成。如图1所示。在此仅对一台从设备进行介绍，其硬件体系主要由测控计算机、Arduino mega2560 操控器、语音辨认单元、声强检测单元、语音组成单元、面板操控单元、仪器面板等组成。面板操控单元较为杂乱，包括多种操控电路，在模仿练习中担任该从设备在Arduino mega2560 操控器的操控下完结整个练习进程，在示教与回放体系中完结对方才操作练习操作现象的重演，其详细电路规划在此不做介绍。

语音辨认单元担任辨认操作人员的操作口令;声强检测单元担任检测声强巨细并以此作为判别是哪台从设备操作人员口令的依据;Arduino mega2560操控器担任监督仪器面板各元件的状况来辨认操作人员的动作，然后完结对操作练习进程的记载。各仪器的操作现象依据操作动作事前编制无需记载。在操作回放进程中，测控计算机依据所记载的数据，经过操控相应从设备的Arduino mega2560操控器重现所记载的操作进程。

2 单元体系规划

2.1 语音辨认单元规划

现在，语音辨认技能的开展十分迅速，依照辨认目标的类型可以分为特定人和非特定人语音辨认。特定人是指辨认目标为专门的人，非特定人是指辨认目标是针对大多数用户，一般需求收集多个人的语音进行录音和练习，经过学习，然后到达较高的辨认率。

本文选用的LD3320语音辨认芯片是一颗依据非特定人语音辨认(Speaker Independent Automatic SpeechRecognition，SI ASR)技能的芯片。该芯片上集成了高精度的A/D 和D/A 接口，不再需求外接辅佐的FLASH 和RAM，即可以完结语音辨认、声控、人机对话功用，供给了真实的单芯片语音辨认处理方案。而且，辨认的要害词语列表是可以动态修改的。其语音辨认进程如图2所示。

语音辨认单元选用ATmega168 作为MCU，担任操控LD3320完结一切和语音辨认相关的作业，并将辨认成果经过串口上传至Arduino mega2560 操控器。对LD3320芯片的各种操作，都必须经过寄存器的操作来完结，寄存器读写操作有2种方法(规范并行方法和串行SPI方法)。在此选用并行方法，将LD3320的数据端口与MCU的I/O口相连。其硬件衔接图如图3所示。

语音辨认流程选用中止方法作业，其作业流程分为初始化、写入要害词、开端辨认和呼应中止等。MCU的程序选用ARDUINO IDE编写[5]，调试完结后经过串口进行烧录，操控LD3320完结语音辨认，并将辨认成果上传至Arduino mega2560操控器。其软件流程如图4所示。

2.2 声强检测单元规划

在进行语音辨认时需求判别是某一台从设备操作人员的口令，为此规划声强检测单元电路，该电路仅需可以判别出相对声强的巨细，无需检测声级，对检测精度要求较低。

%&&&&&%式M%&&&&&%声响传感器将外部声响信号转化成电信号，经NE5532扩大电路进行扩大，将输入的弱小音频信号转化为具有一定幅值的电压信号，该电压信号经AC/DC有效值转化电路进行装换后进行再次扩大，终究由Arduino mega2560操控器的A/D进行采样。图5给出了声强检测单元的电路原理图，其间D1 端接Arduinomega2560操控器的A/D，INT1端接Arduino mega2560操控器的外部中止1.当外界声响信号大于预设的阈值时，三极管导通INT1端由高电平变为低电平发生外部中止，操控器呼应中止并进行 A/D 采样，采样数据经均值滤波后保存，待测控计算机查询时上传该声强数据。

2.3 语音组成单元规划

TTS(Text To Speech)文本转语音技能是人机智能对话开展的趋势。依据TTS技能的语音体系无需事前录音就可以随时依据查询条件查出并组成语音进行播报，然后大大减少了体系维护的作业量。使用此技能，经过MCU或许PC机就能操控语音芯片发音[4]。

本文选用SYN6658中文语音组成芯片进行语音组成。SYN6658 经过UART 接口或SPI接口通讯方法，接纳待组成的文本数据，完结文本到语音(或TTS语音)的转化[6]。操控器和SYN6658 语音组成芯片之间经过UART接口衔接，操控器经过串口通讯向SYN6658语音组成芯片发送操控指令和文本，SYN6658语音组成芯片把接纳到的文本组成为语音信号输出，输出的信号经LM386 功率扩大器进行扩大后衔接到喇叭进行播映。如图6所示。

扫一扫打开手机网站

微信扫一扫关注我们

根据ARM处理器的非特定人语音识别系统规划

联系我们

微信扫一扫关注我们

为您推荐

芯对话 | CBM1764:3A大电流LDO，从继电保护到工业控制

罗姆入选“CDP气候变化”与“CDP水安全”管理“A级”榜单企业

2025第三届西部光电产业创新发展论坛（第一轮通知）

关于邀请参加甘肃（兰州）暖通展览会的函

多轴机器人的时序挑战

无线传输扩频技术和加密通信原理解析

联系我们

微信扫一扫关注我们