共 2 条
基于词典和词频的中文分词方法
被引:19
作者:
张恒
[1
]
杨文昭
[2
]
屈景辉
[1
]
卢虹冰
[1
]
张亮
[1
]
赵飞
[1
]
机构:
[1] 第四军医大学计算机应用教研室
[2] 总装备部炮兵防空兵装备技术研究所
来源:
关键词:
中文分词;
歧义消除;
词频;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
汉语分词是中文信息处理的前提和基础。由于中文句子中,词与词之间没有明显的分隔标志,且存在多音多义词,因此不可避免的存在切分歧义。汉语分词已成为中文信息处理的"瓶颈"。本文通过使用带有词频的词典,采用逐词分解实现了中文自动分词,并使用词频计算、歧义消除等方法提高了分词的准确率。
引用
收藏
页码:239 / 240+232
+232
页数:3
相关论文