信息抽取的语义知识资源研究

被引:18
作者
袁毓林
机构
[1] 北京大学中文系北京 
关键词
信息抽取; 语义资源; 话语篇章; 论元结构; 逻辑结构;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文讨论支持信息抽取的语义资源的建设问题,举例说明了信息抽取至少需要三种层面的语义知识:(i)宏观的话语篇章知识,籍此可以约束信息抽取的匹配模板的类型,预测关键性的信息项目在文本中的分布位置;(ii)中观的论元结构知识,籍此可以建立动词的论元成分跟事件模板的传递与继承关系,帮助确定代词或空语类跟其先行语的回指关系,进而确定其语义所指;(iii)微观的逻辑结构知识,籍此可以确定否定词、量化词、模态词等逻辑算子跟其所约束的成分之间的逻辑关系(比如,哪些成分处于否定的辖域之中,其中哪个成分是否定的焦点,在哪些语法条件下否定词是冗余的,等等)。最后,指出研究这三种语义知识所可利用的几种理论和方法。
引用
收藏
页码:8 / 14
页数:7
相关论文
共 5 条
[1]   流水句中否定的辖域及其警示标志 [J].
袁毓林 .
世界汉语教学, 2000, (03) :22-33
[2]   论元结构理论介绍 [J].
顾阳 .
国外语言学, 1994, (01) :1-11
[3]  
形式语义学引论.[M].蒋严;潘海华著;.中国社会科学出版社.1998,
[4]  
汉语动词的配价研究.[M].袁毓林著;.江西教育出版社.1998,
[5]  
语义学.[M].(英)杰弗里·利奇(GeoffreyLeech)著;李瑞华等译;.上海外语教育出版社.1987,