基于上下文相关的最大概率汉语自动分词算法

被引:7
作者
金瑜
陆启明
高峰
机构
[1] 合肥工业大学理学院
[2] 中国科学技术大学近代物理系
[3] 合肥工业大学理学院 合肥
[4] 合肥
[5] 合肥
关键词
上下文相关; 汉语自动分词; 分词统计模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出了一种新的汉语自动分词算法,其主要思想是通过前后两次对文章的扫描来解决分词过程中出现的交叉歧义问题,介绍了一种新的有效的字段切分算法,它能够排除类似穷举算法中冗余的单字词的切分可能。
引用
收藏
页码:146 / 148
页数:3
相关论文
共 8 条
[1]   基于PATRICIA tree的汉语自动分词词典机制 [J].
杨文峰 ;
陈光英 ;
李星 .
中文信息学报, 2001, (03) :44-49
[2]   基于歧义二叉树的汉语分词方法 [J].
陈其晖 ;
应志伟 ;
柴佩琪 .
计算机辅助工程, 1999, (04) :12-17
[3]   最大概率分词问题及其解法 [J].
刘挺 ;
吴岩 ;
王开铸 .
哈尔滨工业大学学报, 1998, (06) :37-41
[4]   基于两字词簇的汉语快速自动分词算法 [J].
郭祥昊 ;
钟义信 ;
杨丽 .
情报学报, 1998, (05) :34-39
[5]   汉语自动分词研究综述 [J].
骆正清 ;
陈增武 ;
王泽兵 ;
胡上序 .
浙江大学学报(自然科学版), 1997, (03) :31-37
[6]   汉语自动分词研究中的苦干理论问题 [J].
孙茂松,邹嘉彦 .
语言文字应用, 1995, (04) :40-46
[7]   汉语文献自动分词存在的问题及趋向 [J].
王玮,刘丹 .
情报理论与实践, 1994, (06) :28-30
[8]  
数据结构[M]. 清华大学出版社 , 严蔚敏, 1987