基于支持向量机的中文文本中地名识别

被引:16
作者
李丽双
黄德根
陈春荣
杨元生
机构
[1] 大连理工大学计算机科学与工程系
关键词
支持向量机; 中文文本; 地名识别; 机器学习;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69%和93.82%,F-值为90.12%.
引用
收藏
页码:433 / 438
页数:6
相关论文
共 2 条
[1]   基于统计的中文地名识别 [J].
黄德根 ;
岳广玲 ;
杨元生 .
中文信息学报, 2003, (02) :36-41
[2]   中国地名自动识别系统的设计与实现 [J].
谭红叶 ;
郑家恒 ;
刘开瑛 .
计算机工程, 2002, (08) :128-129+270