|
|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.
4 D! S4 y- p4 e7 V
1 \- p* ?4 w7 m, U
3 N3 ]) z+ J/ ?关键词:话音激活检测;长时信息;听觉滤波器;自适应' D/ ^$ C0 p: U
4 L W; k% o2 y5 k% h9 L# o+ d( U8 S) ^. E3 f5 l
8 \3 z8 j8 v: t9 U2 p. v$ R: W
话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能.
1 V' V% v( Q+ m, `( c X
2 }1 `+ {& g4 z e) g( p" k
+ A0 N* i+ S% i& K T
: w1 ]4 K/ d$ \/ I
' s E! P: L" q+ U, |9 ]6 R
+ l0 X) }$ B" b# S8 o) z1 l
8 a* e2 m. p \( u: ]# y1 v2 Q% F8 u
$ K5 W# T8 x" H. h( E3 e! F; a
|
|