中文分词技术的研究现状与困难

被引:39
作者
孙铁利
刘延吉
机构
[1] 东北师范大学计算机学院
关键词
中文分词; 分词算法; 歧义; 未登录词;
D O I
10.13274/j.cnki.hdzj.2009.07.045
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
中文分词技术是中文信息处理领域的基础研究课题。而分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分。首先对中文分词的基本概念与应用,以及中文分词的基本方法进行了概述。然后分析了分词中存在的两个最大困难。最后指出了中文分词未来的研究方向。
引用
收藏
页码:187 / 189+192 +192
页数:4
相关论文
共 16 条
[1]   基于中文的自然语言理解初探 [J].
赵川 ;
杜玲 ;
岳鹏 ;
刘少君 ;
林征胜 ;
赵荣海 .
现代电子技术, 2007, (06) :82-85
[2]   基于动态规划的最小代价路径汉语自动分词 [J].
孙晓 ;
黄德根 .
小型微型计算机系统, 2006, (03) :516-519
[3]   基于统计规则的交集型歧义处理方法 [J].
翟凤文 ;
赫枫龄 ;
左万利 .
吉林大学学报(理学版), 2006, (02) :223-228
[4]   基于有向图的双向匹配分词算法及实现 [J].
陈耀东 ;
王挺 .
计算机应用, 2005, (06) :1442-1444
[5]   基于规则的分词方法 [J].
张江 .
计算机与现代化, 2005, (04) :18-20
[6]   一种基于自动机的分词方法 [J].
吴建胜 ;
战学刚 ;
迟呈英 ;
不详 .
计算机工程与应用 , 2005, (08) :81-82+85
[7]   基于词频统计的中文分词的研究 [J].
费洪晓 ;
康松林 ;
朱小娟 ;
谢文彪 ;
不详 .
计算机工程与应用 , 2005, (07) :67-68+100
[8]   汉语自动分词的研究现状与困难 [J].
张春霞 ;
郝天永 .
系统仿真学报, 2005, (01) :138-143+147
[9]   一种基于后缀数组的无词典分词方法 [J].
张长利 ;
赫枫龄 ;
左万利 .
吉林大学学报(理学版), 2004, (04) :548-553
[10]   一种规则与统计相结合的汉语分词方法 [J].
赵伟 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
计算机应用研究, 2004, (03) :23-25