基于人工智能下语音识别方法与装置及系统的研究

数码
科技资讯
2018年06月12日 19:08

基于人工智能的网页原创评估方法装置及存储介质与流程

熊晓倩

摘 要:随着科学技术的迅猛发展,信息技术水平显著提升,人工智能诞生并且在社会多个领域得到广泛应用,对人们的生产生活都产生了较大的影响。在信息化时代背景下,人工智能机器作为智能化技术的产物,凭借自身独特的特性得到人们高度关注。本文将对目前人工智能语言识别系统的研究现状进行分析,并对语言识别方式加以阐述。

关键词:人工智能 语音识别方法 装置系统

中图分类号:TP183 文献标识码:A 文章编号:1672-3791(2018)01(c)-0017-02

随着科学技术的不断进步,人类已经进入到“智能时代”,机器学习属于智能化领域中一个重点内容。现阶段,人类在语音识别、网络搜索等方面都获得了一定的成就。在人工智能的支持下,能够实现深度问答、自动驾驶等技术的使用,并且在发展过程中,已经超出了人类智能操作功能。在此背景下,应在人工智能基础上,加强对语言识别方式、装置以及系统等研究。

1 目前人工智能语言识别系统的研究现状

1956年,人工智能技术被发明出来,引领科学界开始了一场关于机器模拟智能的相关研讨浪潮,而人工智能也作为一门新兴学科,在社会多个领域中得到广泛应用,促进着社会经济的进步与发展,尤其是在语言识别系统的建设方面。

1.1 在理论研究方面

目前,随着科学技术的迅猛发展,以往传统的语音识别模式已经难以符合当代需求,虽然以往诸多智能设备中,都能够安装了语音识别软件,可以实现人机对话功能,但在算法以及其他方面,语音识别技术的发展已经进入了瓶颈期,难以得到很大的突破。深度学习模型则能够对人类大脑的学习和感知外界信息进行模拟,在理论研究层面较为丰富和完善。但是,在实际运用的过程中缺乏代表性产品。为了能够真正实现理论与实践的有机结合,使人们的现代化需求得到切实满足,在日后对此方面的研究过程中,应加强对语音信号产生、传播等多个方面进行综合分析,进而使此项技术得到全面发展。

1.2 在应用研究方面

近年来,互联网得到了显著的发展和壮大,使得我国社会开始从信息时代迈进智能时代,对于语言识别技术的研究将与时代的发展潮流充分符合,使人们能够从众多渠道和角度中获得原始语音信息。以往对此方面的研究都只是单纯地停留在算法方面,使得数据信息的作用难以得到充分发挥。深度学习理论将能够实现云计算与数据信息的有机结合,进而对数据信息进行直接识别,充分满足了人员对语言数据的应用需求,也使得语言识别系统得到更加良好的发展[1]。

2 人工智能基础上的语音识别方法

2.1 语音拾取及特征提取

在对语音数据的拾取方面主要包括采样和端点检测,其中,采样主要是指通过声卡的作用对语音信息进行收集,然后将其转变为数字化的形式。而端点检测主要是对语音的起点和终点进行确定,属于预处理中的关键内容。在对语音信息进行端点检测时,最常用的算法方式为能量与过零率相结合的方式。另外,在语音识别的过程中,一个十分重要的问题就是特征的选择,良好准确地对特征进行选取,能够使语言之间产生区别,进而对有用语音进行采集,将无用信息进行屏蔽。

2.2 模拟训练与语音识别

在此环节中主要包括两个部分:第一,训练,即选取一种恰当的识别方式,采用训练以及聚类的方式获得该汉字的语言参数,并且将其作为参考加以存储。在识别系统中,应对所有系统需要识别的汉字信息进行存储,进而构成一个参考模板库。第二,识别,将带识别文字与参考数据库中的模板进行对比分析之后,以最为相近的字为所识别汉字,主要包括以下3种方式。

(1)将训练语言所提取的结果作为模板进行直接存储,在进行识别的过程中,将语音信号输入到语音识别系统当中,其将会对汉字的特征进行提取,得到一个待识别字的向量数列,将该序列与模板进行逐一的对比,按照特定的计分或者距离计算出该模板的计分或者距离,并且选择出一个计分或者距离最小的汉字作为识别字。在对距离进行计算的过程中,应注意到训练模板中同一词的瞬时速度之间的差距,因此,应采用时域内弹性匹配概念的方式,对待识别的信号以及模板信号进行计算。

(2)对于每个待识别汉字来说,其存储方式并不是以特征向量为主,而是采用态图的方式来实现。例如:aij代表由i态向j态转移的概率,而bi则代表i态输出的各特征概率,在具体学习的过程中,将会依照各训练语音特征对aij和bi进行估算,標准是在给定训练序列中,由原始态向最终态之间的转变,所得到的输出概率和为最大。当aij和bi的数值固定时,每一训练都能够得到相对应的输出概率,可以利用最优路由求法的方式进行解决,也可以根据实际情况,在最优路由的情况下,对计分算法进行设计。在此背景下,学习的主要意义是为了能够对各态模型中的aij和bi进行计算。在具体识别的过程中,通过计分求法的方式,对待识别汉字利用态图模型的方式进行计算,获得其输出概率。然后,所得计分最大的态图即为所识别到的汉字,这种方式被称之为是隐Markov模型。

(3)为了能够使语音动态与时间之间进行良好的匹配,可以将语音特征序列采用适当的方式进行划分,划分成N段,并且对其中任意区域特征的平均值进行求取,进而得出n个具有特征矢量,可以将其当作模板进行存储。在具体识别的过程中,可以根据本文中第二点的方式对时间和动态进行匹配,然后以特定的距离为标准,距离最小的汉字即为所识别到的汉字[2]。

3 人工智能基础上的语音识别发展前景

从语音识别的方式上来看,主要的识别方式为语音识别、特征识别等,事实证明,在人工智能基础上进行的语言识别,能够为人们的工作和生活提供较大的便利,解决生产生活中遇到的诸多问题。在语音识别系统的设计中,涉及的范围十分广泛,其中包括语音学、心理学以及数理统计等多方面知识,对研究人员的综合素质具有十分严格的要求,因此,在对此方面技术进行研究时,需要掌握多方面知识,才能够更加良好、高效地完成此项工作。

在人工智能研究中,深度学习在多个领域中得到了广泛的应用,其中包括图像、语言、文本等方面;在未来的发展中,语言识别将为人机结合的发展提供重大推动力,使智能系统的使用者获得更加舒适的体验。将上述两种技术相融合具有两方面优势:一方面,通过语言系统能够收集到大量训练数据,使鲁棒性得到显著增强,能够在更深层的网络中得以应用。另一方面,深度网络能够更加促进语音识别系统的精准度,使系统能够有效摆脱外界噪音的干扰和影响,使语音识别的准确度得到有效提升[3]。

4 结语

综上所述,随着社会技术的不断发展,机器学习成为人工智能中的重点问题,并且在网络搜索、语言识别等多个领域中得到广泛应用,极大地促进了社会的高效、可持续发展。在日后的发展中,相关专家和学者应进一步加强对人工智能技术的研究,使其在语音识别系统中的作用得到更大的发挥,促进语言识别系统的更新和优化。

参考文献

[1] 冯琬婷.基于文字识别视角分析人工智能机器学习中的文字识别方法[J].电子技术与软件工程,2017(13):253.

[2] 端木海臣.文字识别视域下的人工智能机器学习的文字识别方法研究[J].电脑编程技巧与维护,2017(12):82-84.

[3] 黄鑫.基于人工智能机器学习的文字识别方法研究[J].通讯世界,2016(13):234.

家电之家©部分网站内容来自网络,如有侵权请联系我们,立即删除!
文章 人工智能 汉字
你该读读这些:一周精选导览
更多内容...

TOP

More