基于词典和词频的中文分词方法

被引:19
作者
张恒 [1 ]
杨文昭 [2 ]
屈景辉 [1 ]
卢虹冰 [1 ]
张亮 [1 ]
赵飞 [1 ]
机构
[1] 第四军医大学计算机应用教研室
[2] 总装备部炮兵防空兵装备技术研究所
关键词
中文分词; 歧义消除; 词频;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
汉语分词是中文信息处理的前提和基础。由于中文句子中,词与词之间没有明显的分隔标志,且存在多音多义词,因此不可避免的存在切分歧义。汉语分词已成为中文信息处理的"瓶颈"。本文通过使用带有词频的词典,采用逐词分解实现了中文自动分词,并使用词频计算、歧义消除等方法提高了分词的准确率。
引用
收藏
页码:239 / 240+232 +232
页数:3
相关论文
共 2 条
[1]   基于条件随机场的汉语分词系统 [J].
李双龙 ;
刘群 ;
王成耀 .
微计算机信息, 2006, (28) :178-180
[2]   高频最大交集型歧义切分字段在汉语自动分词中的作用 [J].
孙茂松 ;
左正平 ;
邹嘉彦 .
中文信息学报, 1999, (01) :28-35