一种基于多元信息库的自适应汉语歧义切分方法

被引:5
作者
朱巧明
温滔
李培蜂
钱培德
机构
[1] 苏州大学计算机科学与技术学院
关键词
多元信息库; 歧义切分; 自适应;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以找出所有可能存在歧义的句子、借助于人工干预建立错误切分歧异词库等,实现汉语歧异切分的方法,通过修改、插入多元信息库中的信息量,进一步设计了一个具有自适应能力的歧义切分方法,并通过实验证明该方法能够有效改进汉语分词中错误歧义切分的结果.
引用
收藏
页码:1597 / 1600
页数:4
相关论文
共 9 条
[1]
一种快速汉语分词算法 [J].
温滔 ;
朱巧明 ;
吕强 .
计算机工程, 2004, (19) :119-120+182
[2]
利用覆盖歧义检测法和统计语言模型进行汉语自动分词 [J].
王显芳 ;
杜利民 .
电子与信息学报, 2003, (09) :1168-1173
[3]
基于N-最短路径方法的中文词语粗分模型 [J].
张华平 ;
刘群 .
中文信息学报, 2002, (05) :1-7
[4]
汉语自动分词研究评述 [J].
孙茂松 ;
邹嘉彦 .
当代语言学, 2001, (01) :22-32+77
[5]
一种高效的中文电子词表数据结构 [J].
陈桂林 ;
王永成 ;
韩客松 ;
王刚 .
计算机研究与发展, 2000, (01) :109-116
[6]
高频最大交集型歧义切分字段在汉语自动分词中的作用 [J].
孙茂松 ;
左正平 ;
邹嘉彦 .
中文信息学报, 1999, (01)
[7]
基于两字词簇的汉语快速自动分词算法 [J].
郭祥昊 ;
钟义信 ;
杨丽 .
情报学报, 1998, (05)
[8]
一种改进的MM分词方法的算法设计 [J].
骆正清 ;
陈增武 ;
胡上序 .
中文信息学报, 1996, (03) :30-36
[9]
基于神经网络的分词方法 [J].
徐秉铮 ;
詹剑 ;
贺前华 .
中文信息学报, 1993, (02) :36-44