汉语自动分词研究评述

被引:106
作者
孙茂松
邹嘉彦
机构
[1] 清华大学
[2] 香港城市大学
关键词
中文信息处理; 汉语自动分词; 切分歧义消解; 未登录词处理; 语言资源建设;
D O I
暂无
中图分类号
H08 [应用语言学];
学科分类号
050211 ;
摘要
本文首先阐述了汉语自动分词研究的现实性和可能性,接着围绕该研究中的三个基本问题(切分歧义消解、未登录词处理和语言资源建设)展开了重点讨论,并扼要评介了十几年来产生的各种方法。最后就这个领域未来的研究要点发表了一些个人意见。
引用
收藏
页码:22 / 32+77 +77
页数:12
相关论文
共 34 条
[1]   谈谈汉语分词语料库的一致性问题 [J].
孙茂松 .
语言文字应用, 1999, (02) :90-93
[2]   消解中文三字长交集型分词歧义的算法 [J].
孙茂松,左正平,黄昌宁 .
清华大学学报(自然科学版), 1999, (05) :102-104+108
[3]   高频最大交集型歧义切分字段在汉语自动分词中的作用 [J].
孙茂松 ;
左正平 ;
邹嘉彦 .
中文信息学报, 1999, (01) :28-35
[4]   关于歧义字段切分的思考与实验 [J].
刘挺 ;
王开铸 .
中文信息学报, 1998, (02) :64-65
[5]   串频统计和词形匹配相结合的汉语自动分词系统 [J].
刘挺 ;
吴岩 ;
王开铸 .
中文信息学报, 1998, (01) :18-26
[6]   中文机构名称的识别与分析 [J].
张小衡 ;
王玲玲 .
中文信息学报, 1997, (04) :22-33
[7]   汉语分词系统中的信息集成和最佳路径搜索方法 [J].
沈达阳 ;
孙茂松 ;
黄昌宁 .
中文信息学报, 1997, (02) :34-47
[8]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[9]   人机并存,“质”“量”合一—谈谈制定信息处理用汉语词表的策略 [J].
孙茂松 ;
张磊 .
语言文字应用, 1997, (01)
[10]   《资讯处理用中文分词规范》设计理念及规范内容 [J].
黄居仁 ;
陈克健 ;
陈凤仪 ;
魏文真 ;
张丽丽 .
语言文字应用, 1997, (01)