基于规则的百科人物属性抽取

被引:6
作者
李红亮
杨燕
尹红风
贾真
机构
[1] 西南交通大学信息科学与技术学院
关键词
人物属性抽取; 规则获取; 自由文本;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
信息抽取是数据挖掘的一个重要领域,文本信息抽取是指从一段自由文本中抽取出指定的信息并将其结构化数据存入知识库供用户查询或下一步处理所用。人物属性信息抽取是智能人物类搜索引擎构建的重要基础,同时结构化信息也是计算机所能理解的一种数据格式。作者提出了一种自动获取百科人物属性的方法,该方法利用各属性值的词性信息来定位到百科自由文本中,通过统计的方法发现规则,再根据规则匹配从百科文本中获取人物属性信息。实验表明该方法从百科文本中抽取人物属性信息是有效的。抽取的结果可以用来构建人物属性知识库。
引用
收藏
页码:1 / 4
页数:4
相关论文
共 6 条
[1]
面向人物追踪的知识挖掘研究 [D]. 
于满泉 .
中国科学院研究生院(计算技术研究所),
2006
[2]
基于规则的学术概念属性抽取 [J].
丁君军 ;
郑彦宁 ;
化柏林 .
情报理论与实践, 2011, 34 (12) :10-14+33
[3]
基于Wikipedia的人名简历信息抽取 [J].
王全剑 ;
李芳 .
计算机应用与软件, 2011, 28 (07) :170-174
[4]
基于规则的高校实验室Web信息抽取的系统设计与实现 [J].
化柏林 ;
郭江 .
现代图书情报技术, 2009, (10) :62-66
[5]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[6]
基于Ontology的文本信息抽取 [J].
陆科进 ;
李新颖 .
计算机应用研究, 2003, (07) :46-48