自然语言处理技术的三个里程碑

被引:18
作者
黄昌宁
张小凤
机构
[1] 微软亚洲研究院
关键词
自然语言处理; 复杂特征集; 词汇主义; 语料库方法; 统计语言模型;
D O I
暂无
中图分类号
H087 [数理语言学];
学科分类号
摘要
半世纪以来自然语言处理 (NLP)研究取得两点重要认识和三大重要成果 ,即认识到 :(1 )对于句法分析 ,基于单一标记的短语结构规则是不充分的 ;(2 )短语结构规则在真实文本中的分布呈现严重扭曲。换言之 ,有限数目的短语结构规则不能覆盖大规模语料中的语法现象。这与原先的预期大相径庭。NLP技术的发展在很大程度上受到这两个事实的影响。从这个意义上说 ,本领域中称得上里程碑式的成果是 :(1 )复杂特征集和合一语法 ;(2 )语言学研究中的词汇主义 ;(3 )语料库方法和统计语言模型。大规模语言知识的开发和自动获取是NLP技术的瓶颈问题。因此 ,语料库建设和统计学理论将成为该领域中的关键课题
引用
收藏
页码:180 / 187+239 +239
页数:9
相关论文
共 1 条
[1]  
现代汉语语法信息词典详解.[M].俞士汶等著;.清华大学出版社.1998,