共 5 条
有限状态机在中文文本分词中的应用
被引:1
作者:
火善栋
机构:
[1] 重庆三峡学院
来源:
关键词:
中文信息处理;
有限状态机;
汉语分词;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
提出并实现一种有限状态机算法,该方法结合二分查找树算法将整个词典构造成一个有限状态机,从而使词典中的每个不同的汉字以不同弧权值的形式存在于有限状态机中。当要判断某个字符串是不是词时,只要从这个有限状态机的第一个状态结点依次进行查找即可。实验显示,通过这个有限状态机词典可以实现对字符串的快速查找。
引用
收藏
页码:30 / 33
页数:4
相关论文