声频信号的时频分析
- 格式:doc
- 大小:2.25 MB
- 文档页数:24
班级 011304
学号 1301120308
题目声频信号的时频分析
学院通信工程学院
专业通信与信息系统
学生姓名白小慧
摘要
我们生活在一个信息社会里,而信息的载体就是信号。在我们身边以及在我们身上,信号是无处不在的。如我们随时可听到的语音信号,随时可看到的视频图像信号,伴随着我们生命始终的心电信号,脑电信号以及心音、脉搏、血压、呼吸等众多的生理信号。
语言作为人类最重要最自然的交流工具,是人类获得信息的重要来源之一.研究声频信号的特性和工业控制领域的语音识别技术,开发实用的语音识别和控制系统,对于语音识别技术的普及与应用具有十分重要的意义。
本文从声音的产生开始,分析声音的特性进而用傅里叶变换和短时傅里叶变换分析声频信号。
关键词:语音识别,傅里叶变换,短时傅里叶变换
ABSTRACT
As the most important and natural tool for human's communication, language is one of the most significant sources for human to get information. The research on the characteristics of the audio signals and the speech recognition technology in the field of industrial control and the development of utility system of speech recognition and control are very significant and necessary for the popularization and application of the speech recognition technology.
This paper introduces the generation of sound ,some analyses on the characteristics of speech are given. In addition, the audio signals is analyzed via the Fourier transform and short-time Fourier transform.
Keywords :speech recognition,Fourier transform,short-time Fourier transform
目录
摘要 (1)
第一章绪论 (4)
第二章基本理论 (5)
2.1语音信号的产生 (5)
2.2语音信号的特性 (5)
2.3傅里叶变换 (5)
2.3.1傅里叶变换的原理 (5)
2.3.2傅里叶变换的计算方法 (6)
2.3.3傅里叶变换的本质 (6)
第三章短时傅立叶变换 (8)
3.1连续信号的短时傅立叶变换 (8)
3.2短时傅立叶反变换 (10)
3.3离散信号的短时傅立叶变换 (11)
第四章语音信号的时频分析仿真 (13)
4.1声音信号的采集 (13)
4.2实验结果 (13)
4.3实验结论 (18)
附录 (20)
第一章绪论
我们生活在一个信息社会里,而信息的载体就是信号。在我们身边以及在我们身上,信号是无处不在的。如我们随时可听到的语音信号,随时可看到的视频图像信号,伴随着我们生命始终的心电信号,脑电信号以及心音、脉搏、血压、呼吸等众多的生理信号。
音频检测是利用现代声学的基础理论和方法所进行的一系列检查和测量的技术应用研究。音频检测技术中同样涉及声音在介质中的相互作用及其产生的特性、特征。声学是音频检测技术的基础,音频检测技术是声学的理论外延及应用手段。音频检测系统及机械、电子、计算机于一身,是声学理论、金属材料检测技术及自动控制技术的综合应用。因此,它具有多功能检测和处理能力以及进一步实现音频检测仪器的智能化。用语音来实现人与计算机之间的交互,主要包括三项技术,语音识别、自然语音理解和语音合成。随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展。与计算机网络技术一样,语音识别技术的广泛应用正在日益改变着人类的生产和生活方式。因此,研究工业控制领域的语音识别技术,开发实用的语音识别和控制系统,对于语音识别技术的,普及与应用具有十分重要的意义。
随着半导体技术特别是数字信号处理器(Digital Signal Processor,DSP)的飞速发展,这就为一维信号和二维图象的实时处理提供了可能。高速器件的发展推动了新的信号处理理论的发展。这些发展给我们的现实生活带来了许多革命性的变化,如语音信箱、自动翻译机、可视电话、会议电视、远程医疗、高清晰度电视、数字相机、移动电话、便携式个人生理参数监护仪(如心电Holter,脑电Holter等)等等。所有这些应用领域都要涉及到信号的滤波、变换、特征提取、编码、量化、压缩等众多环节中的一个或几个。而这些环节都离不开信号的分解。
本文将从声音的时频谱性展开分析,通过傅里叶变换描绘出声音信号的频谱图以及短时傅里叶变换描绘信号的时频图。采集几个声音分别做了它们的傅里叶变换和短时傅里叶变换,观察并比较它们的不同。
第二章基本理论
2.1语音信号的产生
声音是一种波,他是有物体振动产生的,能被人耳听到,他的振动频率在20到20000赫兹之间。自然界产生各种各样的声音,如雷声,树叶被风吹时发出的“飒飒”声,大海波涛汹涌的翻滚声,机械工作时发出的声音等等。音是一种波,它具有以下几种物理特性:1,音质。它是一种声音区别于其他声音的基本特征。2,音调。就是声音的高低。音调取决于声波的频率,频率快音调就高频率慢音调就低。3,响度。响度是表示声音的强弱,它是由声波震动幅度决定的。4,音长。它表示声音的长短,是由发音持续时间决定的。除了物理特性外,它还具有一个重要的性质,这就是声音总是能够表达一定的意义和思想内容。
2.2语音信号的特性
语音信号从总体上看表征其特性的参数都是随时间变化的,这一点可以从语音信号的时域幅度波形上看出。故语音信号是一个非平稳随机过程,不能用处理平稳随机信号的技术对其进行分析处理。由于语音信号是由人的口腔内一系列肌肉运动构成的发声模型产生的,而口腔肌肉的这种运动相对于语音频率来说是非常缓慢的,故在一个短时范围内(一般认为10到30毫秒),其特性基本保持不变,可将其看作“准稳态随机过程”,这就是语音信号的“短时平稳性”。
2.3傅里叶变换
2.3.1傅里叶变换的原理
正交级数的展开是其理论基础。将一个在时域收敛的函数展开成一系列不同频率谐波的叠加,从而达到解决周期函数问题的目的。在此基础上进行推广,从而可以对一个非周期函数进行时频变换。