您的位置 首页 元件

根据智能语音辨认的云电视体系规划

基于智能语音识别的云电视系统设计-该系统在传统的智能电视上加入语音输入和云端网络技术,对语音智能处理之后达到操作电视的作用,可以通过语音输入自动查找或者使用电视功能,提高了智能电视的可操作性,让智能电

  为了进步智能电视的可操作性,文章提出了一种依据智能语音设其他云电视体系规划方案。该体系在传统的智能电视上参加语音输入和云端网络技能,对语音智能处理之后到达操作电视的作用,能够经过语音输入主动查找或许运用电视功用,进步了智能电视的可操作性,让智能电视运用更便利,合适更多的运用人群。

  当时,跟着核算机和互联网技能的高速开展、3c交融的趋势以及电视机的数字化开展,作为家庭文娱中心家电的电视机现已开端向智能化多媒体网络电视方向开展。智能网络电视机是一台多功用的网络终端,用户能够经过该网络终端得到许多信息和服务,但是随同运用功用的添加,其操作也随之变得杂乱。面临智能电视的功用杂乱、操作难问题,仅仅是将电视机的纸质阐明书或许做成电子文档以flash方式在电视机上进行播映,并没有详细的指引用户操作的导航功用,或许说有详细的阐明,电视面临的是任何顾客,许多功用的操作他们也不是很理解,乃至许多功用都找不到。在电子产品智能化的今日,智能语音设别是一个热门话题,该技能的完结进步了电子产品的可操作性,为用户带来了更多的便利。所以规划一个依据智能语音设其他电视体系,用语音来完结快速导航到各个需求的功用、信息、服务等运用成为燃眉之急。

  本体系为依据智能语音设其他云电视体系,将输入的语音数据传输到电视机体系,体系把该模仿语音数据预处理,转化为数字语音信号,依据各个模块需求把数字语音数据发送到云端,云端经过智能语义辨认剖析处理之后,回来详细的控制指令给电视予以处理。

  1.体系总体规划

  该电视体系结构图如图1所示,该体系分三个模块规划,语音设别、电视体系处理、云端处理。在有网络衔接的状况下,经过麦克录入语音,再经过语音模块把录入的语音转化为特定的语音格局传输到云端的中心服务器,云端服务器把传输曩昔的的语音与许多标明特定字符的语音模型进行比较,以供给输入语音所包含特定字符的许多不同或许性。然后,云端服务器生成一个字符序列,依据依据字符的言语模型,这个字符序列标明了输入语音中所包含已知特定字符的特定序列的不同或许性。然后字符序列经过网络被传输到中心服务器,在这儿,字符序列生成一个词汇序列,依据词汇表和依据词汇的言语模型,这个词汇序列标明了输入语音中所包含已知特定字符的特定序列的不同或许性。然后,云端服务器依据词汇表承认哪个特定词汇序列与输入语音最匹配,并将所承认的词汇序列经由网络输送回终端电视机体系,电视机体系再把得到的数据分模块处理(电视机体系不同模块有不同的功用)。该电视体系硬件运用MIPS构架CPU,装备Linux操作体系。语音经过MIC输入,规划有两路MIC接口,运用标准的网络接口用于网络通信。

  2.语音辨认体系规划

  2.1 语音辨认根底常识

  语音设别技能,也被称为主动语音设别,即AutomaTIc Speech RecogniTIon(ASR),其方针是将人类语音中的词汇内容转换为核算机可读的输入,例如按键、二进制编码或许字符序列。与说话人设别及说话人承认不同,后者测验设别或承认宣布语音的说话人而非其中所包含的词汇内容。

  语音辨认体系实质上是一个形式辨认体系。语音辨认一般分两个进程,榜首步是体系“学习”或“练习”阶段。这一阶段的使命是树立辨认根本单元的声学模型以及进行文法剖析的言语模型等。第二步是“辨认”或“测验”阶段。依据辨认体系的类型挑选能够满足要求的一种辨认办法,选用语音剖析办法提取出这种辨认办法所要求的语音特征参数,按照必定的原则和测度与体系模型进行比较,经过判定得出辨认成果。

  2.2 语音设别体系规划

  语音设别体系框图如图2所示。首要要把电视机麦克输入的模仿语音信号进行预处理,云端需求数字语音信号,这儿预处理运用语音IC进行处理,包含预滤波、采样和量化、信号数字化、加窗、断点检测、预加剧等。语音信号经过预处理后,接下来重要的一环便是特征参数提取,其意图是从语音波形中提取出随时刻改动的语音特征序列。把特征提取的成果送到电视机操作体系中进行判别处理,剖析是否需求将其传送到云端服务器,云端服务器在对接纳到的语音进行智能剖析处理之后传回电视机终端,进行相应的功用处理。

  2.3 云端服务器智能处理

  云端服务器处理首要针对数字化语音数据进行剖析处理,本体系的功用比较杂乱,语音处理作业量十分大,该规划依据云核算的服务器来完结,在服务器端对语音进行剖析处理的一同还需求进行智能设别,该智能设别首要针对本电视机体系的一些要害字及语音的语义剖析,一同关于电视机的不同模块进行别离处理,来完结运用者所想的功用。运用云核算服务器能够削减电视机终端的硬件本钱,添加处理速度,来到达对用户指令的智能处理。

  2.3.1 电视机与云端的传输协议

  关于特定的电视机体系,每个模块具有特定的要害字,在传输数据到云端的时分,需求传输模块特征和相应的语音数据。

  2.3.2 语音练习与识其他首要办法

  在云端接纳到数据之后,需求对语音数据进行设别。语音练习与辨认是一个形式练习和识其他进程。形式练习是指按照必定的规矩,对很多练习信息进行处理,获取能够反映该信息实质特征的模型参数,将从这些练习信息中得到的模型参数组合成一个形式库,而形式匹配则是指依据必定的规矩标准,将输入的不知道形式与形式库中的形式进行匹配,从形式库中寻觅一个类似度最高,即最佳匹配的形式。这种练习和匹配的办法有许多种,现在较常见的办法首要有动态时刻规整(DTW)、隐马尔可夫链(HMM)模型、人工神经网络(ANN)等。

  2.3.3 隐马尔可夫链模型

  本体系用隐马尔可夫链(Hidden Markov Models,HMM)模型来对语音进行练习和辨认,在隐马尔可夫链模型中,它运用马尔可夫链来模仿信号核算特性的改动,实质上它是一个两层随机进程的概率模型。榜首重随机进程的概率模型是指由马尔可夫链来标明状况之间的搬运,其他一重随机进程的概率模型是指每个状况和多个观测值之间的随机对应联系。在实际问题的运用中,HMM的两层随机进程调查者不能直接看到状况,只能看到调查值,且只要运用一个随机进程去感知状况的存在以及特征。实质上说,人类的言语进程也是一个两层随机进程。语音信号自身是一个能够被观测到的时变序列,是由人的大脑依据语法常识和言语的需求而宣布的音素的参数流,这部分就相关于 HMM模型中不行观测的各种状况。HMM模型能够很好地模仿这个两层随机进程,而且很好地描绘了语音信号的部分平稳性以及全体的非平稳性,是一种描绘语音信号的抱负模型。

  2.3.4 智能语音辨认

  此处选用的要害字辨认体系为依据接连语音辨认(LVCSR)的要害词辨认体系,如图3所示,运用这种结构适用于接连语音要害词辨认体系:言语经过接连语音音节辨认器后,发生相应的N-Best词格或音节网格,然后运用要害词查找算法对网格进行要害词查找。其进程能够大致分红三步:榜首步,查找语音基元,也便是说经过这次查找得到输入语音对应的拼音序列。经过接连解码,能够得到一个N- Best音节序列或许音节的网格。第二步,针对电视机终端功用模块挑选不同的要害词表。第三步,依据上一步得到的音节序列和要害词词表对照,进行要害词的查找,得到假象射中(或许成为要害词的词)。第四步,依据其他常识源剖析第三步得到的设想射中的置信度,给出要害词识其他成果。第五步,对第四步输出的要害字成果进行智能处理,依据特定的电视机体系功用模块给出终究的输出成果。

  3.电视机智能语音辨认处理软件流程

  3.1 录音检测

  电视机智能语音辨认处理流程图如图4,在需求运用语音设别时,首要需求按下录音键,这个时分体系会检测网络是否衔接和麦克是否能够正常运用,假如其中有一项检测失利,体系不会做录音作业,提示查看网络或许查看麦克。

  3.2 录音处理

  在设备检测之后,进行录音,因为体系约束,录音有时刻约束,不能太长。电视机终端把麦克录下的语音进行预处理和特征提取,然后再把语音和模块特征一同传输到云端服务器,云端服务器再做详尽的处理,处理之后再把数据传回终端电视机。

  3.3 智能功用处理

  在电视机终端等候接纳数据,在5秒之内没有接纳到数据,视为TIme out,数据处理失利。假如接纳到数据后做相应的处理,在云端就有对各个模块的要害字辨认,将传回的数据再针对相应的模块做判别处理。比如在主功用界面,假如语音输入“shezhi”,体系将进入设置界面。或许在影视界面,假如输入“halibote”,体系会查找哈利波特这部影片。

  4.试验运用

  因为电视体系在运用进程中状况比较杂乱,经过语音设其他精确率也有一些差异。为了得到相对精确的数据,测验分几种状况,一种是在电视体系没有播映audio的时分和在播映audio的时分,另一种是输入语音的长度不一致的状况。

  4.1 测验喧闹环境试验

  这个测验分两种状况,一种是没有播映audio的时分(或许说audio mute的时分),一种是在有播映audio的时分(因为audio播映时分贝不一样,所以以各种喧闹环境的归纳值为主),试验成果见表1:

  4.2 测验改动输入要害字长度试验

  本体系为智能语音设别,需求做智能剖析,经过输入语音来判别体系的动作,要害是在语音设其他精确性和智能辨认处理上,而输入要害字的长度对体系的精确性判别适当要害。本次试验便是针对长度不一致的输入做剖析,试验成果见表2:

  从两个测验来看,体系辨认精确率适当高,试验到达了预期的作用。要害是在特别环境下进行处理时,本体系在辨认之后还有要害字和智能处理,以到达更好的智能处理。

  5.结语

  该体系选用了高效的语音设别技能和安稳的MIPS硬件渠道为根底,软件规划上以Linux操作体系为根底,在原有的智能电视体系上运用云核算处理语音数据,使之体系处理实时性更高。经过测验标明,该体系能十分精确地判别语音输入,数据处理速度快,体系安稳性高。此体系到达了在电视体系中运用智能语音设其他功用,这样经过语音操作,大大进步了体系的可操作性,使之运用便利,愈加智能化。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/xinpin/yuanjian/172850.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部