面向自然语言文本的否定性与不确定性信息抽取

被引:29
作者
邹博伟
钱忠
陈站成
朱巧明
周国栋
机构
[1] 苏州大学计算机科学与技术学院
关键词
信息抽取; 否定性信息; 不确定性信息; 线索词检测; 覆盖域界定;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
目前,信息抽取研究主要面向肯定性信息,而自然语言文本中包含了大量否定性和不确定性信息,为了将此类信息与肯定性信息区分开,有必要针对否定性与不确定性信息抽取进行深入研究.针对这一任务,首次构建了一个16 841句的汉语语料资源,利用序列标注模型与卷积树核模型,系统地探索了各种序列化依存特征和结构化句法树特征的有效性,并提出了元决策树模型,对二者进行融合.实验结果显示,该方法在否定性和不确定性信息抽取任务上的精确率分别达到69.84%和58.57%,为相关研究打下了坚实的基础.
引用
收藏
页码:309 / 328
页数:20
相关论文
共 4 条
[1]
否定词跨标点句管辖的判断 [J].
张瑞朋 ;
宋柔 .
中文信息学报, 2007, (05) :131-135
[2]
Combining classifiers with meta decision trees [J].
Todorovski, L ;
Dzeroski, S .
MACHINE LEARNING, 2003, 50 (03) :223-249
[3]
A simple algorithm for identifying negated findings and diseases in discharge summaries [J].
Chapman, WW ;
Bridewell, W ;
Hanbury, P ;
Cooper, GF ;
Buchanan, BG .
JOURNAL OF BIOMEDICAL INFORMATICS, 2001, 34 (05) :301-310
[4]
Hedges: A study in meaning criteria and the logic of fuzzy concepts.[J].George Lakoff.Journal of Philosophical Logic.1973, 4