基于互联网自然标注资源的自然语言处理

被引:17
作者
孙茂松 [1 ,2 ]
机构
[1] 清华大学计算机科学与技术系
[2] 清华大学智能技术与系统国家重点实验室
关键词
自然标注资源; 用户产生数据; 互联网; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出了"基于互联网自然标注资源的自然语言处理"的学术思想,并从自然标注资源的定义和基本类型、基于自然标注资源的计算、方法论层面上的初步思考等三个角度对这一学术思想进行了初步的阐发。最后指出了其中的一个基础问题:如果我们把全部自然标注资源所能提供的全部信息或知识都以一种系统的方式用到了极致,并且把它们最大限度地有机集成起来,机器能否如愿以偿地获得对自然语言一定深度的理解呢?
引用
收藏
页码:26 / 32
页数:7
相关论文
共 3 条
[1]  
汉语动补结构的产生与演变[M]. 学林出版社 , 梁银峰著, 2006
[2]  
陆俭明自选集[M]. 河南教育出版社 , 陆俭明著, 1993
[3]   Punctuation as Implicit Annotations for Chinese Word Segmentation [J].
Li, Zhongguo ;
Sun, Maosong .
COMPUTATIONAL LINGUISTICS, 2009, 35 (04) :505-512