文档之家
首页
教学研究
幼儿教育
高等教育
外语考试
建筑/土木
经管营销
自然科学
当前位置:
文档之家
›
《音频处理技术》PPT课件
《音频处理技术》PPT课件
格式:ppt
大小:1.45 MB
文档页数:156
下载文档原格式
下载原文件
/ 156
下载本文档
合集下载
下载提示
文本预览
1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
动态范围不仅用来表示一个声源产生的最大声压级与 最小声压级之间的差值,录音设备或记录声音的载体( 磁带、光盘、硬盘)同样可用动态范围表示能够处理信 号电平的范围。
如磁带的动态范围为50dB~60dB, CD光盘96dB, 磁光盘录放音机105dB。
刘海燕
12
动态范围可以用信号的相对强度表示:
6
0.80 -9.36672 -9
…… ……
……
9 0.45 -1.63831 -2 10 0.50 7.89216 8
20 1.00 4.40090
刘海燕
4
31
对于CD—DA,采样频率为44.1kHz,即每 秒取44100个点。幅度的取值范围是限制在 216=65 536以内,量化间隔为1,即量化幅 度可以取65 536个不同的值,计算机中用 16位的存储空间就可以表示一个量化后的 数值。动态范围为20×1g(216)≈96dB
声波可以用一条连续的曲线来表示,它在时间和幅度上都是连续的 ,称为模拟音频信号。
在任一时刻,声波可以分解成一系列正弦波的线性叠加:
刘海燕
4
正弦波
刘海燕
5
声音的物理特性
周期/频率/带宽
两个相邻波之间的时间长度为周期T ,单位为秒;
每秒钟声源振动的次数称为频率f,单位Hz;
f=1/T
描述组成复合信号的频率范围,称为带宽。
声音信号可被分解和复合,可以从中抽出若干 个单一的正弦信号,也可以用若干个单一的正 弦信号来合成任意波形的复合信号,如合成语 音和合成音乐等
刘海燕
8
声压和声强
声波在空气媒质中是以空气中的分子振动形成疏密而 传播。它造成空气中的气压发生大小变化,相当于在 无声波下空气中的气压上叠加一个变化的压强,叠加 上的压强称为声压,记作P。单位有帕斯卡(Pa)和微 巴(μbar)。
刘海燕
23
(2)动态范围
动态范围越大,说明音频信号强度的相对 变化范围越大,音响效果越好。
动态范围一般用dB为单位来计量。
FM广播的动态范围约60dB, AM广播的动态范围约40dB。 CD—DA的动态范围约100dB, 数字电话约50dB。
刘海燕
24
(3)信噪比
信噪比SNR(Signal Noise Ratio)是有用信号与噪 声之比的简称,即有用信号的平均功率与噪声的 平均功率之比
在声学中引用分贝来表示声压或声强的变化程度 。因为人的听觉神经的刺激程度不与刺激量大小 成正比,而是按刺激量以10为底的对数增长
刘海燕
10
刘海燕
11
动态范围
声音的动态范围指声音的最大声压级和最小声压级之 间的差值。
每种声源的动态范围依据各自的特性有所不同。
如女声的动态范围为25~50dB, 男声为30~50dB, 交响乐队的动态范围大于100dB。
引起人耳刚能听到声音时的声压称为可听阈
声波是由能量来维持传播的。如扬声器纸盆的振动是 由电能转换而来,因此声波有能量。
单位时间内通过垂直于声波传播方向的单位面积内的 声波能量为声场中某点的声强,记作I,单位为瓦/米2 (W/m2)。
声强与声压最大值的平方成正比关系。
刘海燕
9
在无线电技术中常引用分贝(dB)来表征电压、电 流、功率或放大器的放大能力。
采样是每隔一定的时间测量一次声音信号的幅值,把时间连续的 模拟信号转换成时间离散、幅度连续的采样信号。如果采样的时 间间隔相等,这种采样称为均匀采样;
量化是按“四舍五入”或其他方法将采样得到的数值限定在几个有限 的数值中,将采样信号转换成时间离散、幅度离散的数字信号;
编码(coding)是将量化后的信号转换成一个二进制码组输出。 比如,量化得到的数据中只会出现两个数值51和80,则只用一位 二进制的数表示即可,用0表示51,用1表示80。若量化级别为 256(有256级量化数据),则可用8位二进制数表示,这种编码 方法称为自然编码。
声源到达听者耳朵的声音有两个,其中一个声音 直接到达,而另一个由于人头部遮蔽,需绕过头 部才能到达。称前者为直达声,而后者为绕射声 。
若有两个声源,增大其中一个声源的强度,由于 该声音源发出的直达声或绕射声的声压大于另一 个声源,双耳将会产生声压级差。使听者感受的 声源(声像)位置向强度较大的声源方向移,使 人感受到声音的立体感。
1.声音的数字化
数字化就是将连续信号变成离散信号。 对音频信号,首先在时间上离散,取有限个时
间点,称为采样。 然后在幅度上离散,取有限个幅度值,称为量
化。 再将得到的数据表示成计算机容易识别的格式
,称为编码。
刘海燕
26
(1) PCM编码
PCM是一种把模拟信号转换成数字信号的最基本的编码方 法,它主要包括采样、量化和编码3个过程。
刘海燕
32
PCM编码原理
编码的过程首先用一组脉冲采样时钟信号与输入 的模拟音频信号相乘,相乘的结果就是离散时间 信号,然后对采样后的信号幅值进行量化。
量化过程由量化器来完成。对经量化器A/D(模 /数)变换后的信号再进行编码,即把量化的信号 电平转换成二进制码组,就得到了离散的二进制 数据序列x(n),
由于人的外耳具有一定的耳道长度,耳道会对某段频率 产生共鸣,使灵敏度提高。因此人耳听到声音的响度与 声音的频率有关。描述响度、声压以及声源频率之间的 关系曲线称为等响度曲线。
从曲线看出,当音量开到使声压级为80 dB时,就可做 到高低频声音丰满
刘海燕
18
音色
音色又称音品。通常说法是:声音的音调 和响度以外的音质差异叫做音色。
在0-1秒内,取21个采样点。在1、1/20、 2/20、……19/20、1秒时刻采样,将采样 得到的数值取整,即得到量化数据。
刘海燕
30
表2-1 连续波形的数字化
序号 采样点 采样数据 量化值 序号 采样点 采样数据 量化值
0 1 2 3 4 5 ……
0.00 0.05 0.10 0.15 0.20 0.25 ……
刘海燕
21
空间感
一个声源发出的声音同时向各个方向散开,其发 散的角度取决于声源所具有的指向性,发散的声 波有一小部分直接传给听者,而大部分会被空间 表面反射,然后到达听者。由于直接和经反射到 达听者的两个声音途径存在差别(取决于环境) 而带来时间差。当时间差超过一定数量时,听者 会听到先后到达的两个声音,从而产生回音。经 多次反射,造成余声。即使声源已停止发声,但 听者仍能听到声音存在。
信号的动态范围=20×lg(信号的最大强度/信号的最 小强度)(dB)
其中的信号可以用电压或功率衡量。
因为是一种比例关系,故只要采用相同的度量 单位,其结果都是一致的。
刘海燕
13
频谱
物体在一定位置的附近作来回往复的运动,称 为简谐振动。
简谐振动会产生一个特定音调的纯音,听起来 感觉单薄。
乐器很少产生单一频率的纯音,而是复音。 复音的产生基于物体的复杂振动,可以分解为
掩蔽利用掩蔽效应可以用有用信号去掩蔽无用的声信 号,只需要把无用声音的声压级降低到掩蔽阈以 下即可。
在数字音频处理中,还可以利用掩蔽效应去掉人 耳听不到的那部分信号进行声音数据的压缩。
刘海燕
20
方位感
人凭借双耳在一定声学环境内能够对声源定位, 这种能力来自于声源发出的声波到达双耳间的强 度差、时间差以及耳廓(外耳)的阻挡。
回声与余音的感觉可使听者感受出房间体积大小 、房间高低及内表面结构上的差异,这便是空间 感。
刘海燕
22
2.音频信号的质量指标
(1) 频带宽度
音频信号所包含的谐波分量越丰富,音色越好。 在广播通信和数字音响系统中,以声音信号所包 含的谐波分量的频率范围来衡量声音的质量,即 带宽。
不同质量的声音的频带对比示意图
刘海燕
27
模拟声音信号的采样和量化过程示意
刘海燕
28
例2.1 设一个连续信号的波形可以表示为
设采样频率为21Hz,[-10,10]内的量化间 隔取为1,试计算出该信号0到1秒内的量化 数据(p29)。
。
刘海燕
29
设采样频率为21Hz,[-10,10]内的量化间 隔取为1,试计算出该信号0到1秒内的量化 数据。
信噪比大,在一定程度上能够掩蔽噪声,从而获 得较好的声音效果。
信噪比不仅是声音设备的性能指标,在声音的录 制和播放时,也要注意环境噪声。录制时应尽可 能减小环境噪音。输出时应使音量适当大,以减 少环境噪音对听音的影响。
一般话筒和音箱的信噪比在75dB以上。声卡的信 噪比在85~95dB。
刘海燕
25
2.2 数字音频
刘海燕
缺点: 不能充分利用为 适应幅度大的输 入信号,增加的 样本的位数.
35
非线性量化的思想是大的输入信号采用大的量化 间隔,小的输入信号采用小的量化间隔,
这样就可以在满足精度要求的情况下用较少的位 数来表示。声音数据还原时,采用相同的规则。
刘海燕
36
在非线性量化中,采样输入信号幅度和量化输出 数据之间定义了两种对应关系:一种称为μ律压扩 算法;一种成为A律压扩算法。
9.41421 -7.66754 1.30867 1.07930 -3.46729 8.93433
……
9 -8 1 1 -3 9 ……
11 12 13 14 15 16 ……
0.55 -9.37474 -9
0.60 4.73547 5
0.65 -2.56445 -3
0.70 0.40759
0
0.75 6.34915
音调
人对声音频率的感觉表现为音调的高低,在音 乐中称为音高。音调与基频的对数(20×lg) 成 线性关系,单位为美(mei)。基频越低, 给人的感觉越低沉。基频频率增加一倍,音乐 上称提高了一个八度
刘海燕
16
频率与音调的关系
刘海燕
17
响度
响度是人耳对声音强弱的感觉 程度
虽然响度与衡量声音强弱的声 压有一定关系,但与声压的大 小并不完全一致,也就是说声 压大的感觉不一定响。
非均匀量化的实现方法通常是将抽样值通过压缩 再进行均匀量化。所谓压缩就是实际上是对大信 号进行压缩而对小信号进行较大的放大的过程。 信号经过这种非线性压缩电路处理后,改变了大 信号和小信号之间的比例关系,使大信号的比例 基本不变或变得较小,而小信号相应地按比例增 大,即“压大补小”。
计算机对量化后的二进制数据可以用文件的形式 存储、编辑和处理,并可还原成原始的模拟信号 播放。还原的过程称为解码,它是A/D变换的逆 过程,即D/A(数/模)变换
刘海燕
33
PCM编码示意图
PCM编码示意图
刘海燕
34
(2)均匀量化和分均匀量化
量化时,如果采用相等的量化间隔对采样得到 的信号作量化,那么这种量化称为均匀量化。 均匀量化采用相同的“等分尺”来度量采样得到 的幅度,也称为线性量化.
声音的音色取决于该声音的频谱结构或是 频谱包络(声波曲线)。
高次谐波越丰富,音色就越有明亮感和穿透 力。此外,音色还与诸多其他因素有关, 如听音条件等。
它是一个主观量,常用柔和、刺耳、饱满 等词描述。
刘海燕
19
掩蔽效应
称听不到的声音为被掩蔽声,而起掩蔽作用的声 音为掩蔽声。
掩蔽效应的实质是掩蔽声的出现使人耳听觉的等 响度曲线的最小可听阈抬高。
许多不同振幅和不同频率的简谐振动(即看成简 谐振动的叠加)。 简谐振动的振幅按频率排列的图形称为频谱。 频谱可一目了然地看出复杂振动的频率结构。
刘海燕
14
钢琴(基频为253Hz)的复音频谱
刘海燕
15
(2)声音的心理学特性
从声学心理角度,声音的三个要素是音调 、响度和音色。它们与声波的频率、声压 和频谱结构对应。
第2章 音频处理技术
1
简述
音频是多媒体技术中媒体的一种,由于音 频信号是一种连续变化的模拟信号,而计 算机只能处理和记录二进制的数字信号, 因此,音频信号必须经过一定的变化和处 理,变成二进制数据后才能送到计算机进 行编辑和存储。
刘海燕
2
2.1 声音的基本特性
音频信号所携带的信息大体上可分为语音 、音乐和音响三类。
振 幅
t
周
刘期海 燕
6
(1)声音的物理特性
频率/周期/带宽
单位时间内声源振动的次数或空气中气压疏密变 化的次数,称为声源的频率f,单位赫兹(Hz)
频带宽度或称之为带宽,它描述组成复合信号的 频率范围
刘海燕
7
虽然高于20kHz频率的声音人耳听不到,但由 于人的声学心理特性,可感觉到它的存在。因 此,有的音响产品的工作频率上限为50kHz, 甚至调音台的最高工作频率设计到100kHz。
语音是指具有语言内涵和人类约定的特殊媒体 ;
音乐是规范的符号化了的声音; 而音响指其他自然声音,如动物的叫声、机器
的轰鸣声、风雨雷电声等
刘海燕
3
1.音频信号的特征
机械振动或气流扰动引起周围弹性媒质发生波动,产生声波。产生 声波的物体为声源(如人的声带、乐器等),声波所及的空间范围称 为声场。声波传到人耳,经过人类听觉系统的感知就是声音。
文档推荐
最新文档
清华版小学信息技术四年级上册教案设计
我的第一次采风
玫瑰花馒头(红曲粉)的做法【食谱-你要的家常菜】
江西省南昌市2015-2016学年2015-2016学年高二上学期联考化学试卷【解析版】
粤教版信息技术基础《使用搜索引擎:网络世界,我行、我速》优秀教学设计
注重课堂教学,提高教学效率
一种基于像素奇偶性和tanh函数的图像加解密算法
江西省南昌市第三中学高二化学上学期期中试卷
第七届江苏技能状元大赛网络安全、无人机应用技术项目(职工组)镇江市选拔赛在江苏省交通技师学院举行
2023年水性聚氨酯涂料行业市场调查报告