基于双向匹配法和特征选择算法的中文分词技术研究

被引:10
作者
麦范金 [1 ]
李东普 [2 ]
岳晓光 [3 ]
机构
[1] 桂林理工大学图书馆
[2] 桂林理工大学信息科学与工程学院
[3] 广西民族师范学院数学与计算机科学系
关键词
双向最大匹配; 特征选择算法; 中文分词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
传统的双向匹配算法虽然能够发现歧义现象,但是却不能解决歧义问题.为了更好地进行歧义消解,提出了一种基于双向匹配法和特征选择算法的中文分词技术,通过积累的语料库,设计并实现了一个基于两种方法的分词系统.该系统的实验结果表明,基于双向匹配法和特征选择算法的中文分词技术比传统方法的效果要好.
引用
收藏
页码:47 / 51
页数:5
相关论文
共 7 条
[1]  
普通话三千常用词表.[M].郑林曦编;.文字改革出版社.1987,
[2]   利用浅层句法分析提取特征的词义消歧 [J].
孙超 ;
张仰森 .
计算机工程与设计, 2010, 31 (21) :4704-4707
[3]  
基于WordNet词义消歧的系统融合.[J].刘宇鹏;李生;赵铁军;.自动化学报.2010, 11
[4]   基于深层特征抽取的日文词义消歧系统 [J].
雷雪梅 ;
王大亮 ;
田中贵秋 ;
曾广平 .
北京科技大学学报, 2010, 32 (02) :263-269
[5]   基于最大熵模型的汉语词义消歧与标注方法 [J].
张仰森 .
计算机工程, 2009, 35 (18) :15-18
[6]   汉语分词中组合歧义字段的研究 [J].
秦颖 ;
王小捷 ;
张素香 .
中文信息学报, 2007, (01) :3-8
[7]   统计词义消歧的研究进展 [J].
卢志茂 ;
刘挺 ;
李生 .
电子学报, 2006, (02) :333-343