语音识别技术论文

格式：docx
大小：86.67 KB
文档页数：6

下载文档原格式

/ 6

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

摘要：语音识别技术是一门涉及面很广的交叉学科。

随着新理论的提出和应用，语音识别技术取得了很大的进步,许多产品已经得以实际的应用，但在其进一步的发展进程中，还有许多棘手的问题有待解决。

关键词：语音识别；动态时间规整算法；人工神经元网络
1 背景介绍
语言是人类特有的功能,是人们思维最重要的寄托体，是人类交流最主要的途径。

语音是语言的声学表现，是人类交流信息最自然、最有效、最方便的手段。

语言和语音与人类
社会科学文化发展紧密相连。

语音识别技术是让机器接收，识别和理解语音信号，并将其转换成相应的数字信号的
技术。

它是一门交叉学科，涉及到语音语言学、数理统计、计算机、信号处理等一系列学科。

2 发展历史
1952年贝尔实验室的Davis等人研制成功了能识别十个英文数字发音的Audry系统，标志着语音识别技术研究工作开始。

20世纪60年代计提出了动态规划(Dynamic programming)和线性预测分析技术（Liner Predictive）等重要成果。

20世纪70年代，语音识别领域取得了突破。

实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别
系统。

20世纪80年代语音识别研究进一步走向深入, 基于特定人孤立语音技术的系统研
制成功, 隐马尔可夫模型和人工神经元网络(Artificial Neural Network)在语音识别中的成
功应用。

进入20世纪90年代后语音识别系统开始从实验室走向实用。

我国对语音识别的研究开始于20世纪80年代，近年来发展迅速，并取得了一系列的成果。

3 具体应用
随着计算机技术、模式识别等技术的发展，适应不同场合的语音识别系统相继被开发
出来，语音识别及处理技术已经越来越突现出其强大的技术优势。

近三十年来，语音识别
在计算机、信息处理、通信与电子系统、自动控制等领域的应用越来越广泛。

在许多政府部门、商业机构，语音识别技术的应用，可免除大量操作人员的重复劳动，既经济又方便。

如：语音邮件、IP电话和IP传真、电子商务、自动语音应答系统、自动
语音信箱、基于IP的语音、数据、视频的CTI系统、综合语音、数据服务系统、自然语音识别系统、专家咨询信息服务系统、寻呼服务、故障服务、秘书服务、多媒体综合信息服务、专业特别服务号(168自动信息服务系统，112、114、119等信息查询系统)等。

许多特定环境下，如工业控制方面，在一些工作环境恶劣、对人身有伤害的地方(如地下、深水及辐射、高温等)或手工难以操作的地方，均可通过语音发出相应的控制命令，让设备完成各种工作。

当今，语音识别产品不仅在人机交互中，占到的市场比例越来越大，而且在许多领域
都有了广阔的应用前景，在人们的社会生活中起着举足轻重的作用。

4 语音识别系统原理
语音识别一般分为两个步骤：学习阶段和识别阶段。

学习阶段的任务是建立识别基本
单元的声学模型以及语言模型。

识别阶段是将输入的目标语音的特征参数和模型进行比较，得到识别结果。

语音识别过程如图所示。

下面对该流程作简单介绍：
（1）语音采集设备如话筒、电话等将语音转换成模拟信号。

（2）数字化一般包括预滤波、采样和A/D变换。

该过程将模拟信号转变成计算机能
处理的数字信号。

（3）预处理一般包括预加重、加窗分帧。

经预处理后的信号被转换成了帧序列的加
窗的短时信号。

（4）参数分析是对短时信号进行分析，提取语音特征参数的过程，如时域、频域分析，矢量量化等。

（5）语音识别是目标语音根据特征参数与模型库中的参数进行匹配，产生识别结果
的过程。

一般有模板匹配法、随机模型法和神经网络等。

（6）应用程序根据识别结果产程预定动作。

（7）该过程是语音模型的学习过程。

5 现有算法介绍
语音识别常用的方法有：模板匹配法、人工神经网络法。

（1）模板匹配法是语音识别中常用的一种相似度计算方法。

模板匹配法一般将语音
或单词作为识别单元，一般适用于词汇表较小的场合。

在训练阶段，对用户语音进行特征
提取和特征维数的压缩，这个过程常用的方法是采用矢量量化（VQ）技术。

然后采用聚类方法或其他方法，针对每个模式类各产生一个或几个模板。

识别阶段将待识别的语音模式
的特征参数与各模板进行相似度的计算，将最高相似者作为识别结果。

但由于用户在不同
时刻发同一个音的时间长度有较大随意性，所以识别时必须对语音时间进行伸缩处理。

研
究表明，简单的线性伸缩是不能满足要求的。

由日本学者板仓在70年代提出的动态时间
伸缩算法（DTW）很好的解决了这一问题。

DTW算法能够较好地解决小词汇量、孤立词
识别时说话速度不均匀的难题。

DTW算法示意图如图所示。

设测试的语音参数共有M帧矢量，而参考模板有N帧矢量，且M≠N，则DTW 就是寻找一个时间归整函数tn=f(tm)，它将测试矢量的时间轴tm非线性地映射到模板的时间轴tn上，并使该函数满足第k帧（k=1，2，…M）测试矢量I和第f(k)帧（f(k)=1,2…N）模板矢量J之间的距离测度之和最小:
另外，在实际识别系统中，语音的起点或终点由摩擦音构成，环境噪声也比较大，语
音的端点检测会存在较大的误差。

DTW 算法起点点可以固定在(tm,tn)=(1，1)，称为固定起点；也可以选择在(1，2)、(2，1)等点，称为松驰起点。

同样，中止点可以选择在(M,N)点，称为固定终点；也可以选择在(N一1,M)、(N，M一1)等点，称为松弛终点。

松弛的DTW 算法的起始点从(1，1)、(1，2)、(2，1)等点中选择一最小值，终止点从(M,N)、(M,N-1)、(M-1,N)等点中选择一最小值，两语音样本之间的相互距离在相应的点放松后选择一最小距离。

松弛DTW可以克服由于端点检测不精确引起的误差，但运算量加大。

（2）人工神经网络法。

现实世界的语音信号会随着许多特征如：说话人语速、语调
以及环境的变化而动态变化的，想要用传统的基于模板的方法建立一个适应动态变化的语
音识别系统是非常困难的。

因此需要设计一个带有自学习能力的自适应识别系统，以便可
以适应语音的动态变化。

人工神经网络由神经元、网络拓朴和学习方法构成。

人工神经网络拓朴结构可分为反
馈型和非反馈型（前馈型）。

学习方法可分为监督型和非监督型。

各种人工神经网络模型
中应用得最典型的是采用反向传播（Back Propagation）学习算法的多层前馈网络。

多层前馈型网络如图所示。

除上述介绍的几种常用的方法外，还有许多其它的识别方法以及改进算法。

6 尚未解决的问题及值得研究的方向
（1）就算法模型方面而言，需要有进一步的突破。

声学模型和语言模型是听写识别
的基础。

目前使用的语言模型只是一种概率模型，还没有用到以语言学为基础的文法模型，而要使计算机确实理解人类的语言，就必须在这一点上取得进展。

（2）语音识别的自适应性也有待进一步改进。

同一个音节或单词的语音不仅对随着
的讲话者的不同而变化,而且对同一个讲话者在不同场合,不同上下文环境中也会发生变化。

这意味着对语言模型的进一步改进。

（3）语音识别技术还需要能排除各种环境因素的影响。

目前，对语音识别效果影响
最大的就是环境杂音或噪音。

要在嘈杂环境中使用语音识别技术必须有特殊的抗噪麦克风
才能进行，这对多数用户来说是不现实的。

在公共场合中，如何让语音识别技术能有摒弃
环境嗓音并从中获取所需要的特定声音是一个艰巨的任务。

虽然在短期内还不可能造出具有和人相比拟的语音识别系统，但在未来几年内，语音
识别系统的应用将更加广泛，各种语音识别系统产品将陆续进入我们的生活。

语音识别各
个方面的技术正在不断地进步，一步步朝着更加智能化的方向发展。

参考文献
［1］杨尚国，杨金龙.语音识别技术概述［J］.福建电脑，2006，（8）.
［2］孙宁,孙劲光,孙宇. 基于神经网络的语音识别技术研究［J］. 计算机与数字工程，2006.
［3］Phil Woodland. Speech Recognition. Speech and Language Engineering-State of the Art (Ref. No. 1998/499).
［4］Morgan, N.. Bourlard, H.A.Neural networks for statistical recognition of
continuous speech. Proceedings of the IEEE Volume 83,Issue 5,May 1995 Page(s):742-772.
THANKS
致力为企业和个人提供合同协议，策划案计划书，学习课件等
等
打造全网一站式需求
欢迎您的下载，资料仅供参考。

基于语音识别的智能小车设计-毕设论文

页数:39
基于单片机的语音识别系统毕业设计

页数:45
基于单片机的智能语音识别系统设计毕业设计论文

页数:57
语音识别机器人的设计—毕业论文

页数:17
【完整版】基于Matlab的语音识别系统的设计本科毕业论文设计

页数:59
六年级信息技术《语音识别》教学设计

页数:4
(完整版)基于单片机的语音识别系统好毕业设计论文

页数:52
基于单片机的语音识别系统_毕业设计推荐

页数:48
基于单片机的语音识别智能家居控制系统设计

页数:4
用于智能家居语音识别系统设计

页数:9

语音识别技术论文

合集下载

相关主题

文档推荐

最新文档