利用加权特征模型改进问句分类

被引:3
作者
黄鹏 [1 ]
卜佳俊 [1 ]
陈纯 [1 ]
康志明 [1 ]
陈伟 [1 ]
胡洪涛 [2 ]
机构
[1] 浙江大学计算机科学与技术学院
[2] 浙江丽水电业局
关键词
问句分类; 特征加权; 聚类; 信息熵;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
为了减少目前大多数问句分类算法由于采用了布尔特征模型所导致的特征信息损失,提出了一个基于网络和聚类技术的加权特征模型来表达问句的特征空间.不同于以往采用的布尔特征模型将特征赋值为0或1以表示相应特征出现与否,新的加权特征模型将特征加权为一个位于区间0~1.0的一个实数,以区分不同的特征对于问句分类的贡献:权值越大,相应特征对于区分问句的类型做出的贡献越大.试验结果表明,该加权特征模型在问句分类领域优于之前被广泛使用的布尔特征模型.
引用
收藏
页码:994 / 998+1123 +1123
页数:6
相关论文
共 1 条
[1]  
Automat-ic query expansion using SMART:TREC 3. BUCKLEY C,SALTON G,ALLAN J,et al. Over-view of the Third Text REtrieval Conference(TREC-3) . 1995