一种基于SVM/RS的中文机构名称自动识别方法

被引:17
作者
宇缨
王晓龙
刘秉权
机构
[1] 哈尔滨工业大学计算机学院
关键词
模式识别; SVM; 特征选择; 语义; 粗糙集; 语义搭配;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
该文提出一种支持向量机(support Vector Machines,SVM)和粗糙集(Rough Set,RS)相结合的巾文机构名称短语识别方法。该方法借助词的基术语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学>J 到机构名称构成规则的无冗余集。识别时,首先寻找到与这些规则匹配的词串作为候选机构名,然后结合候选机构名以及其上下文词的语义特征,利用SVM分类器判断该候选是否是真正的机构名称。这种方法对1617万字人尾日榴语赳开卉々jIj=『Il请的F信钋剐诀到R,f16%.
引用
收藏
页码:895 / 900
页数:6
相关论文
共 2 条
[1]
An algorithm that learns what's in a name [J].
Bikel, DM ;
Schwartz, R ;
Weischedel, RM .
MACHINE LEARNING, 1999, 34 (1-3) :211-231
[2]
SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297