基于多尺度分形维数的汉语语音声韵切分

被引:13
作者
王帆
郑方
吴文虎
机构
[1] 清华大学计算机科学与技术系
[2] 智能技术与系统国家重点实验室
[3] 智能技术与系统国家重点实验室 北京
[4] 北京
关键词
声韵切分; 分形; 汉语语音识别;
D O I
10.16511/j.cnki.qhdxxb.2002.01.019
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。
引用
收藏
页码:68 / 71
页数:4
相关论文
共 7 条
[1]  
A finite element model of fluid flow in the vocal tract. Thomas T J. Computer Speech and Language . 1986
[2]  
Chaos and fractals. Peitgen O,Jurgens H,Saupe D. . 1992
[3]  
The Fractal Geometry of Nature. Mandelbort B B. . 1982
[4]  
Fractal Everywhere. Barnsley M. . 1988
[5]  
Fractal aspects of speech signals: dimension and interpolation. Maragos P. Proc IEEE Int Conf Acoust , Speech,Signal Proc . 1991
[6]  
Nonlinear dynamical analysis of speech. Kumar K,Mullick S K. The Journal of The Acoustical Society of America . 1996
[7]  
Measuring the fractal dimension of signals: morphological covers and iterative optimization. Maragos P,Sun F K. IEEE Transactions on Signal Processing . 1993