共 5 条
基于最大匹配的中文分词概率算法研究
被引:16
作者:
何国斌
赵晶璐
机构:
[1] 西南大学计算机与信息科学学院
来源:
关键词:
分词词典;
跳跃表;
分词算法;
概率算法;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
结合顺序表和跳跃表的快速查询特性,提出一种改进的整词分词词典结构,主要采用哈希法和二分法进行分词匹配,并针对机械分词算法的特点,引入随机数,探讨一种基于最大匹配的分词概率算法。实验表明,该算法具有较高的分词效率和准确率,对消去歧义词也有较好的性能。
引用
收藏
页码:173 / 175
页数:3
相关论文