基于核函数的命名实体关系抽取技术研究

被引:0
作者
刘克彬
机构
[1] 上海交通大学
关键词
信息抽取; 实体关系抽取; 核函数; 语义;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
随着计算机的普及以及互联网的迅猛发展,大量的信息以电子文本的形式出现在人们面前。为了应对信息爆炸带来的挑战,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的信息。信息抽取(Information Extraction)研究正是在这种背景下产生的。信息抽取的主要目的是将无结构的文本转化为结构化或半结构化的信息,并以数据库的形式存储,供用户查询以及进一步分析利用。 信息抽取有三个基本任务,命名实体识别、实体关系抽取和事件发现。实体关系抽取不仅是信息抽取的一项重要任务,也是事件发现和多种应用系统的基础,具有重要意义。实体关系抽取的基本任务是寻找并判定实体对之间存在的特定关系。当前主要的抽取技术可分为基于知识库的抽取算法、基于特征向量的机器学习算法、基于核函数的机器学习算法、基于模式的Bootstrapping算法。 本文的工作在命名实体识别的基础上重点研究了实体关系抽取技术并实现了一个完整的实体关系抽取系统。通过深入分析关系抽取技术的重点和难点以及现有技术的特点和不足,设计实现了基于改进的语义核
引用
收藏
页数:66
共 3 条
[1]
一种自举的二元关系和二元关系模式获取方法 [J].
姜吉发 ;
王树西 .
中文信息学报, 2005, (02) :71-77
[2]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[3]
基于权值调整的文本分类改进方法 [J].
鲁明羽 ;
李凡 ;
庞淑英 ;
陆玉昌 ;
周立柱 .
清华大学学报(自然科学版), 2003, (04) :513-515+520