基于机器学习的无需人工编制词典的切词系统

被引:22
作者
黄萱菁
吴立德
王文欣
叶丹瑾
机构
[1] 复旦大学计算机科学系
关键词
贝努里概型; 相关度; 广义似然比; 查全率; 查准率;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
本文介绍了一个基于自学习的无需人工编制词典的切词系统.首先用统计方法建立起附有相关度的切词词典.然后,提出将切词问题转化为一个有向图中求解最大加权路径问题,并提出利用词典中的相关度信息切分文本的一个新算法.最后,我们对词典和切词的质量都作了系统的分析,并与其他方法作了性能比较.
引用
收藏
页码:297 / 303
页数:7
相关论文
共 4 条