您的位置 首页 芯闻

解析规划ARM语音识别系统的过程

伴着高新技能在军事范畴的大范围利用,武器装备逐渐向高、精、尖方面开展。传统的军事练习因为练习时刻长、练习费用高、练习空间窄,常常不能到达预期

伴着高新技术在军事领域的大范围运用,武器装备逐步向高、精、尖方面展开。传统的军事操练由于操练时间长、操练费用高、操练空间窄,常常不能抵达预期的操练效果,已不能满足现代军事操练的需求。为处理上述问题,仿照操练应运而生。

为进一步进步操练效果,这篇文章运用智能语音交互芯片规划了某仿照操练器的示教与回放体系。示教体系为操作人员生动的演示标准操作流程及相应的操作表象,极大地缩短了对操作人员的操练时间,进步了操练效果。回放体系通过记载操作操练进程中各操作人员的口令、动静强度、动作、时间、操作表象等,待操作操练完毕后通过重演操练进程,以便操作者及时纠正自个的问题。示教体系也可理解为对标准操作操练进程的回放。该体系不需求虚拟现实技术的支撑,在小型的嵌入式体系上就可以结束。

1 体系原理

该仿照操练器由一台测控计算机和多台从设备构成。如图1所示。在此仅对一台从设备进行介绍,其硬件体系主要由测控计算机、Arduino mega2560 控制器、语音辨认单元、声强检测单元、语音组成单元、面板控制单元、仪器面板等构成。面板控制单元较为杂乱,包括多种控制电路,在仿照操练中担任该从设备在Arduino mega2560 控制器的控制下结束整个操练进程,在示教与回放体系中结束对刚才操作操练操作表象的重演,其具体电路规划在此不做介绍。

语音辨认单元担任辨认操作人员的操作口令;声强检测单元担任检测声强大小并以此作为判别是哪台从设备操作人员口令的根据;Arduino mega2560控制器担任监督仪器面板各元件的情况来辨认操作人员的动作,然后结束对操作操练进程的记载。各仪器的操作表象根据操作动作事前编制无需记载。在操作回放进程中,测控计算机根据所记载的数据,通过控制相应从设备的Arduino mega2560控制器重现所记载的操作进程。

2 单元体系规划

2.1 语音辨认单元规划

其时,语音辨认技术的展开十分迅速,按照辨认方针的类型可以分为特定人和非特定人语音辨认。特定人是指辨认方针为专门的人,非特定人是指辨认方针是针对大多数用户,一般需求搜集多自己的语音进行录音和操练,通过学习,然后抵达较高的辨认率。

这篇文章选用的LD3320语音辨认芯片是一颗根据非特定人语音辨认(Speaker Independent Automatic SpeechRecognition,SI ASR)技术的芯片。该芯片上集成了高精度的A/D 和D/A 接口,不再需求外接辅佐的FLASH 和RAM,即可以结束语音辨认、声控、人机对话功用,供应了实在的单芯片语音辨认处理方案。并且,辨认的要害词语列表是可以动态修改的。

语音辨认单元选用ATmega168 作为MCU,担任控制LD3320结束全部和语音辨认有关的作业,并将辨认效果通过串口上载至Arduino mega2560 控制器。对LD3320芯片的各种操作,都必须通过寄存器的操作来结束,寄存器读写操作有2种办法(标准并行办法和串行SPI办法)。在此选用并行办法,将LD3320的数据端口与MCU的I/O口相连。

语音辨认流程选用间断办法作业,其作业流程分为初始化、写入要害词、初步辨认和照应间断等。MCU的程序选用ARDUINO IDE编写,调试结束后通过串口进行烧录,控制LD3320结束语音辨认,并将辨认效果上载至Arduino mega2560控制器。

2.2 声强检测单元规划

在进行语音辨认时需求判别是某一台从设备操作人员的口令,为此规划声强检测单元电路,该电路仅需可以判别出相对声强的大小,无需检测声级,对检测精度需求较低。

电容式MIC动静传感器将外部动静信号改换成电信号,经NE5532扩展电路进行扩展,将输入的弱小音频信号改换为具有一定幅值的电压信号,该电压信号经AC/DC有效值改换电路进行装换后进行再次扩展,终究由Arduino mega2560控制器的A/D进行采样。其间D1 端接Arduinomega2560控制器的A/D,INT1端接Arduino mega2560控制器的外部间断1.当外界动静信号大于预设的阈值时,三极管导通INT1端由高电平变为低电平发生外部间断,控制器照应间断并进行A/D 采样,采样数据经均值滤波后保存,待测控计算机查询时上载该声强数据。

2.3 语音组成单元规划

TTS(Text To Speech)文本转语音技术是人机智能对话展开的趋势。根据TTS技术的语音体系无需事前录音就可以随时根据查询条件查出并组成语音进行播报,然后大大减少了体系维护的作业量。运用此技术,通过MCU或许PC机就能控制语音芯片发音。

这篇文章选用SYN6658中文语音组成芯片进行语音组成。SYN6658 通过UART 接口或SPI接口通讯办法,接收待组成的文本数据,结束文本到语音(或TTS语音)的改换。控制器和SYN6658 语音组成芯片之间通过UART接口联接,控制器通过串口通讯向SYN6658语音组成芯片发送控制指令和文本,SYN6658语音组成芯片把接收到的文本组成为语音信号输出,输出的信号经LM386 功率扩展器进行扩展后联接到喇叭进行播放。

SYN6658语音组成电路选用芯片硬件数据手册供应的典型运用电路进行规划,在此不做介绍,功率扩展电路选用美国国家半导体出产的音频功率扩展器LM386进行扩展。

在进行语音组成时首要进行初始化,包括发音人选择、数字处理战略、语速调度、语调调度、音量调度等。

由于该体系要仿照多人发音,所以不一样的从设备设置不一样的发音人及语调与语速以便于差异。初始化后等候测控计算机的语音组成指令,待收到指令后芯片会向上位机发送1字节的情况回传,上位机可根据这个回传来判别芯片其时的作业情况。

3 体系软件规划

示教与回放体系的软件规划包括测控计算机的软件规划和各从设备Arduino mega260控制器的软件规划。

测控计算机是整个体系的控制中心,其软件选用C#进行编写,在示教与回放体系中主要是对操作数据的记载以便根据所记载的数据对操作进程进行精确回放,需求记载的数据包括:各从设备操作人员的操作口令,操作动作,口令及动作时间,各操作对应的操作表象。为简化记载数据,事前编制好各工作代码,记载进程只记载代码,大大进步程序功率。

在操作操练进程中测控计算机每隔50 ms 对下位机进行控制及轮询,并记载反响数据,在数据记载时以50 ms 为一个单位。选用定时器对时间进行控制。在回放进程中首要比对其时时间和所记载的时间,当所记载的时间与其时时间吻合时测控计算机控制下位机实行该工作,结束工作回放。

Arduino mega2560控制器担任接收测控计算机的控制指令并实行指令,读取语音辨认效果,对声强数据搜集和处理,控制语音组成单元进行语音组成等。Arduinomega2560 控制器选用串口间断的办法进行指令接收。

只需正确接收到指令才会实行并回传效果,若测控计算机在约束时间内未收到回传效果则标明发生过错,测控计算机需从头发送。

这篇文章运用智能语音芯片规划了某仿照操练器的示教与回放体系,该体系不需求现在盛行的虚拟现实技术的支撑,仅在MCU的控制下就可以工作。该体系也可以在小型的便携式设备上结束,具有出色的运用前景。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/news/xinwen/147893.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部