基于人工智能下语音识别方法与装置及系统的研究_数码_

基于人工智能的网页原创评估方法装置及存储介质与流程

熊晓倩

摘要：随着科学技术的迅猛发展，信息技术水平显著提升，人工智能诞生并且在社会多个领域得到广泛应用，对人们的生产生活都产生了较大的影响。在信息化时代背景下，人工智能机器作为智能化技术的产物，凭借自身独特的特性得到人们高度关注。本文将对目前人工智能语言识别系统的研究现状进行分析，并对语言识别方式加以阐述。

关键词：人工智能语音识别方法装置系统

中图分类号：TP183 文献标识码：A 文章编号：1672-3791（2018）01（c）-0017-02

随着科学技术的不断进步，人类已经进入到“智能时代”，机器学习属于智能化领域中一个重点内容。现阶段，人类在语音识别、网络搜索等方面都获得了一定的成就。在人工智能的支持下，能够实现深度问答、自动驾驶等技术的使用，并且在发展过程中，已经超出了人类智能操作功能。在此背景下，应在人工智能基础上，加强对语言识别方式、装置以及系统等研究。

1 目前人工智能语言识别系统的研究现状

1956年，人工智能技术被发明出来，引领科学界开始了一场关于机器模拟智能的相关研讨浪潮，而人工智能也作为一门新兴学科，在社会多个领域中得到广泛应用，促进着社会经济的进步与发展，尤其是在语言识别系统的建设方面。

1.1 在理论研究方面

目前，随着科学技术的迅猛发展，以往传统的语音识别模式已经难以符合当代需求，虽然以往诸多智能设备中，都能够安装了语音识别软件，可以实现人机对话功能，但在算法以及其他方面，语音识别技术的发展已经进入了瓶颈期，难以得到很大的突破。深度学习模型则能够对人类大脑的学习和感知外界信息进行模拟，在理论研究层面较为丰富和完善。但是，在实际运用的过程中缺乏代表性产品。为了能够真正实现理论与实践的有机结合，使人们的现代化需求得到切实满足，在日后对此方面的研究过程中，应加强对语音信号产生、传播等多个方面进行综合分析，进而使此项技术得到全面发展。

1.2 在应用研究方面

近年来，互联网得到了显著的发展和壮大，使得我国社会开始从信息时代迈进智能时代，对于语言识别技术的研究将与时代的发展潮流充分符合，使人们能够从众多渠道和角度中获得原始语音信息。以往对此方面的研究都只是单纯地停留在算法方面，使得数据信息的作用难以得到充分发挥。深度学习理论将能够实现云计算与数据信息的有机结合，进而对数据信息进行直接识别，充分满足了人员对语言数据的应用需求，也使得语言识别系统得到更加良好的发展[1]。

2 人工智能基础上的语音识别方法

2.1 语音拾取及特征提取

在对语音数据的拾取方面主要包括采样和端点检测，其中，采样主要是指通过声卡的作用对语音信息进行收集，然后将其转变为数字化的形式。而端点检测主要是对语音的起点和终点进行确定，属于预处理中的关键内容。在对语音信息进行端点检测时，最常用的算法方式为能量与过零率相结合的方式。另外，在语音识别的过程中，一个十分重要的问题就是特征的选择，良好准确地对特征进行选取，能够使语言之间产生区别，进而对有用语音进行采集，将无用信息进行屏蔽。

2.2 模拟训练与语音识别

在此环节中主要包括两个部分：第一，训练，即选取一种恰当的识别方式，采用训练以及聚类的方式获得该汉字的语言参数，并且将其作为参考加以存储。在识别系统中，应对所有系统需要识别的汉字信息进行存储，进而构成一个参考模板库。第二，识别，将带识别文字与参考数据库中的模板进行对比分析之后，以最为相近的字为所识别汉字，主要包括以下3种方式。

（1）将训练语言所提取的结果作为模板进行直接存储，在进行识别的过程中，将语音信号输入到语音识别系统当中，其将会对汉字的特征进行提取，得到一个待识别字的向量数列，将该序列与模板进行逐一的对比，按照特定的计分或者距离计算出该模板的计分或者距离，并且选择出一个计分或者距离最小的汉字作为识别字。在对距离进行计算的过程中，应注意到训练模板中同一词的瞬时速度之间的差距，因此，应采用时域内弹性匹配概念的方式，对待识别的信号以及模板信号进行计算。

（2）对于每个待识别汉字来说，其存储方式并不是以特征向量为主，而是采用态图的方式来实现。例如：aij代表由i态向j态转移的概率，而bi则代表i态输出的各特征概率，在具体学习的过程中，将会依照各训练语音特征对aij和bi进行估算，標准是在给定训练序列中，由原始态向最终态之间的转变，所得到的输出概率和为最大。当aij和bi的数值固定时，每一训练都能够得到相对应的输出概率，可以利用最优路由求法的方式进行解决，也可以根据实际情况，在最优路由的情况下，对计分算法进行设计。在此背景下，学习的主要意义是为了能够对各态模型中的aij和bi进行计算。在具体识别的过程中，通过计分求法的方式，对待识别汉字利用态图模型的方式进行计算，获得其输出概率。然后，所得计分最大的态图即为所识别到的汉字，这种方式被称之为是隐Markov模型。

（3）为了能够使语音动态与时间之间进行良好的匹配，可以将语音特征序列采用适当的方式进行划分，划分成N段，并且对其中任意区域特征的平均值进行求取，进而得出n个具有特征矢量，可以将其当作模板进行存储。在具体识别的过程中，可以根据本文中第二点的方式对时间和动态进行匹配，然后以特定的距离为标准，距离最小的汉字即为所识别到的汉字[2]。

3 人工智能基础上的语音识别发展前景

从语音识别的方式上来看，主要的识别方式为语音识别、特征识别等，事实证明，在人工智能基础上进行的语言识别，能够为人们的工作和生活提供较大的便利，解决生产生活中遇到的诸多问题。在语音识别系统的设计中，涉及的范围十分广泛，其中包括语音学、心理学以及数理统计等多方面知识，对研究人员的综合素质具有十分严格的要求，因此，在对此方面技术进行研究时，需要掌握多方面知识，才能够更加良好、高效地完成此项工作。

在人工智能研究中，深度学习在多个领域中得到了广泛的应用，其中包括图像、语言、文本等方面；在未来的发展中，语言识别将为人机结合的发展提供重大推动力，使智能系统的使用者获得更加舒适的体验。将上述两种技术相融合具有两方面优势：一方面，通过语言系统能够收集到大量训练数据，使鲁棒性得到显著增强，能够在更深层的网络中得以应用。另一方面，深度网络能够更加促进语音识别系统的精准度，使系统能够有效摆脱外界噪音的干扰和影响，使语音识别的准确度得到有效提升[3]。

4 结语

综上所述，随着社会技术的不断发展，机器学习成为人工智能中的重点问题，并且在网络搜索、语言识别等多个领域中得到广泛应用，极大地促进了社会的高效、可持续发展。在日后的发展中，相关专家和学者应进一步加强对人工智能技术的研究，使其在语音识别系统中的作用得到更大的发挥，促进语言识别系统的更新和优化。

参考文献

[1] 冯琬婷.基于文字识别视角分析人工智能机器学习中的文字识别方法[J].电子技术与软件工程，2017（13）：253.

[2] 端木海臣.文字识别视域下的人工智能机器学习的文字识别方法研究[J].电脑编程技巧与维护，2017（12）：82-84.

[3] 黄鑫.基于人工智能机器学习的文字识别方法研究[J].通讯世界，2016（13）：234.