共 34 条
汉语自动分词研究评述
被引:106
作者:

孙茂松
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学

邹嘉彦
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学
机构:
[1] 清华大学
[2] 香港城市大学
来源:
关键词:
中文信息处理;
汉语自动分词;
切分歧义消解;
未登录词处理;
语言资源建设;
D O I:
暂无
中图分类号:
H08 [应用语言学];
学科分类号:
050211 ;
摘要:
本文首先阐述了汉语自动分词研究的现实性和可能性,接着围绕该研究中的三个基本问题(切分歧义消解、未登录词处理和语言资源建设)展开了重点讨论,并扼要评介了十几年来产生的各种方法。最后就这个领域未来的研究要点发表了一些个人意见。
引用
收藏
页码:22 / 32+77
+77
页数:12
相关论文
共 34 条
[1]
谈谈汉语分词语料库的一致性问题
[J].
孙茂松
.
语言文字应用,
1999, (02)
:90-93

孙茂松
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系智能技术与系统国家重点实验室
[2]
消解中文三字长交集型分词歧义的算法
[J].
孙茂松,左正平,黄昌宁
.
清华大学学报(自然科学版),
1999, (05)
:102-104+108

孙茂松,左正平,黄昌宁
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系
[3]
高频最大交集型歧义切分字段在汉语自动分词中的作用
[J].
孙茂松
;
左正平
;
邹嘉彦
.
中文信息学报,
1999, (01)
:28-35

孙茂松
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学智能技术与系统国家重点实验室

左正平
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学智能技术与系统国家重点实验室

邹嘉彦
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学智能技术与系统国家重点实验室
[4]
关于歧义字段切分的思考与实验
[J].
刘挺
;
王开铸
.
中文信息学报,
1998, (02)
:64-65

刘挺
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机系

王开铸
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机系
[5]
串频统计和词形匹配相结合的汉语自动分词系统
[J].
刘挺
;
吴岩
;
王开铸
.
中文信息学报,
1998, (01)
:18-26

论文数: 引用数:
h-index:
机构:

吴岩
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机系

王开铸
论文数: 0 引用数: 0
h-index: 0
机构: 哈尔滨工业大学计算机系
[6]
中文机构名称的识别与分析
[J].
张小衡
;
王玲玲
.
中文信息学报,
1997, (04)
:22-33

张小衡
论文数: 0 引用数: 0
h-index: 0
机构: 香港理工大学中文及双语学系

王玲玲
论文数: 0 引用数: 0
h-index: 0
机构: 香港理工大学中文及双语学系
[7]
汉语分词系统中的信息集成和最佳路径搜索方法
[J].
沈达阳
;
孙茂松
;
黄昌宁
.
中文信息学报,
1997, (02)
:34-47

沈达阳
论文数: 0 引用数: 0
h-index: 0
机构: 汕头大学计算机科学研究所!汕头

孙茂松
论文数: 0 引用数: 0
h-index: 0
机构: 汕头大学计算机科学研究所!汕头

黄昌宁
论文数: 0 引用数: 0
h-index: 0
机构: 汕头大学计算机科学研究所!汕头
[8]
利用汉字二元语法关系解决汉语自动分词中的交集型歧义
[J].
孙茂松
;
黄昌宁
;
邹嘉彦
;
陆方
;
沈达阳
.
计算机研究与发展 ,
1997, (05)
:14-21

孙茂松
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系

论文数: 引用数:
h-index:
机构:

邹嘉彦
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系

陆方
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系

沈达阳
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系
[9]
人机并存,“质”“量”合一—谈谈制定信息处理用汉语词表的策略
[J].
孙茂松
;
张磊
.
语言文字应用,
1997, (01)

孙茂松
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系

张磊
论文数: 0 引用数: 0
h-index: 0
机构: 清华大学计算机科学与技术系
[10]
《资讯处理用中文分词规范》设计理念及规范内容
[J].
黄居仁
;
陈克健
;
陈凤仪
;
魏文真
;
张丽丽
.
语言文字应用,
1997, (01)

黄居仁
论文数: 0 引用数: 0
h-index: 0

陈克健
论文数: 0 引用数: 0
h-index: 0

陈凤仪
论文数: 0 引用数: 0
h-index: 0

魏文真
论文数: 0 引用数: 0
h-index: 0

张丽丽
论文数: 0 引用数: 0
h-index: 0