学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
情感语音特征对语料库依赖性的统计分析
被引:3
作者
:
论文数:
引用数:
h-index:
机构:
孙颖
张雪英
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
张雪英
机构
:
[1]
太原理工大学信息工程学院
来源
:
噪声与振动控制
|
2011年
/ 04期
关键词
:
声学;
信号处理;
情感语音识别;
语料库依赖性;
情感特征;
混合语料库;
D O I
:
暂无
中图分类号
:
TN912.34 [语音识别与设备];
学科分类号
:
0711 ;
摘要
:
简述线性预测倒谱系数(LPCC)、Teager能量算子(TEO)、梅尔频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)特征提取方法,并将这四种方法应用于情感识别。设计两种实验,第一种是使用TYUT和Berlin语料库的单语言实验,这种实验证明,以上四种特征在单一的语料库单一语言条件下均能够有效地表征语音的情感特征,其中MFCC特征对情感的识别率最高。第二种实验是混合语料库的单一语言实验。之前大多数关于情感特征的研究都是基于某一种语料库中某种特定语言的,但在实际中,说话人的背景环境总是多种多样。因此,对特征的混合语料库研究是有现实意义的。第二种实验证明这四种特征都是语料库依赖性的,其中ZCPA特征的识别率下降最少。
引用
收藏
页码:132 / 136
页数:5
相关论文
共 6 条
[1]
一种孤立词语音识别的实现方法及改进
[J].
论文数:
引用数:
h-index:
机构:
刘丽媛
;
论文数:
引用数:
h-index:
机构:
严家明
.
现代电子技术,
2010,
33
(16)
:109
-112
[2]
改进的混合MFCC语音识别算法研究
[J].
论文数:
引用数:
h-index:
机构:
袁正午
;
论文数:
引用数:
h-index:
机构:
肖旺辉
.
计算机工程与应用 ,
2009,
(33)
:108
-110
[3]
情绪的心理控制与认知研究策略
[J].
论文数:
引用数:
h-index:
机构:
罗跃嘉
;
吴健辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院心理研究所心理健康重点实验室
吴健辉
.
西南师范大学学报(人文社会科学版),
2005,
(02)
:26
-29
[4]
一种基于听觉模型的抗噪语音识别特征提取方法
[J].
焦志平
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
焦志平
;
张雪英
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
张雪英
;
赵姝彦
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
赵姝彦
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
不详
.
太原理工大学学报 ,
2005,
(01)
:13
-15+22
[5]
An evaluation of the robustness of existing supervised machine learning approaches to the classification of emotions in speech
[J].
Shami, Mohammad
论文数:
0
引用数:
0
h-index:
0
机构:
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Shami, Mohammad
;
Verhelst, Werner
论文数:
0
引用数:
0
h-index:
0
机构:
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Verhelst, Werner
.
SPEECH COMMUNICATION,
2007,
49
(03)
:201
-212
[6]
Emotional speech recognition: Resources, features, and methods[J] . Dimitrios Ververidis,Constantine Kotropoulos.Speech Communication . 2006 (9)
←
1
→
共 6 条
[1]
一种孤立词语音识别的实现方法及改进
[J].
论文数:
引用数:
h-index:
机构:
刘丽媛
;
论文数:
引用数:
h-index:
机构:
严家明
.
现代电子技术,
2010,
33
(16)
:109
-112
[2]
改进的混合MFCC语音识别算法研究
[J].
论文数:
引用数:
h-index:
机构:
袁正午
;
论文数:
引用数:
h-index:
机构:
肖旺辉
.
计算机工程与应用 ,
2009,
(33)
:108
-110
[3]
情绪的心理控制与认知研究策略
[J].
论文数:
引用数:
h-index:
机构:
罗跃嘉
;
吴健辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院心理研究所心理健康重点实验室
吴健辉
.
西南师范大学学报(人文社会科学版),
2005,
(02)
:26
-29
[4]
一种基于听觉模型的抗噪语音识别特征提取方法
[J].
焦志平
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
焦志平
;
张雪英
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
张雪英
;
赵姝彦
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
赵姝彦
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学信息工程学院
不详
.
太原理工大学学报 ,
2005,
(01)
:13
-15+22
[5]
An evaluation of the robustness of existing supervised machine learning approaches to the classification of emotions in speech
[J].
Shami, Mohammad
论文数:
0
引用数:
0
h-index:
0
机构:
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Shami, Mohammad
;
Verhelst, Werner
论文数:
0
引用数:
0
h-index:
0
机构:
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Vrije Univ Brussel VIB, Dept ETRO DSSP, Lab Digital Speech & Audio Proc, Interdisciplinary Inst Broadband Technol, B-1050 Brussels, Belgium
Verhelst, Werner
.
SPEECH COMMUNICATION,
2007,
49
(03)
:201
-212
[6]
Emotional speech recognition: Resources, features, and methods[J] . Dimitrios Ververidis,Constantine Kotropoulos.Speech Communication . 2006 (9)
←
1
→