HMM模型和句法分析相结合的事件属性信息抽取附视频

被引:9
作者
吴家皋 [1 ,2 ]
周凡坤 [1 ,2 ]
张雪英 [3 ]
机构
[1] 南京邮电大学计算机学院
[2] 江苏省无线传感网高技术研究重点实验室
[3] 南京师范大学虚拟地理环境教育部重点实验室
关键词
自然语言处理; 中文文本信息抽取; 隐马尔科夫模型; 句法分析; 触发词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,其中信息抽取是近年来新兴起的一个研究领域.由于汉语自身结构松散、语法语义灵活等特点,使得中文文本中信息抽取具有较大的难度.本文提出句法分析和隐马尔科夫模型相结合的事件属性抽取方法,其主要思想是先利用句法分析对中文文本进行分析,将得到的句法结构交给隐马尔科夫模型进行学习得到一个抽取模型,然后再由此模型对中文文本进行抽取.实验表明,该方法具有较高的准确率和召回率.
引用
收藏
页码:30 / 34
页数:5
相关论文
共 6 条
[1]   基于改进HMM的文本信息抽取模型 [J].
梁吉光 ;
田俊华 ;
姜杰 .
计算机工程, 2011, 37 (20) :178-179+182
[2]   汉语定义语句的抽取方法 [J].
张寅生 .
计算机与数字工程, 2011, 39 (10) :45-47+112
[3]   基于依存关系的句法分析统计模型 [J].
袁里驰 .
中南大学学报(自然科学版), 2009, 40 (06) :1630-1635
[4]   Biomedical events extraction using the hidden vector state model [J].
Zhou, Deyu ;
He, Yulan .
ARTIFICIAL INTELLIGENCE IN MEDICINE, 2011, 53 (03) :205-213
[5]   A trigram hidden Markov model for metadata extraction from heterogeneous references [J].
Ojokoh, Bolanle ;
Zhang, Ming ;
Tang, Jian .
INFORMATION SCIENCES, 2011, 181 (09) :1538-1551
[6]  
Personalized text snippet extraction using statistical language models[J] . Qing Li,Yuanzhu Peter Chen.Pattern Recognition . 2009 (1)