面向社会网络的人物关系抽取研究

被引:0
作者
彭成
机构
[1] 苏州大学
关键词
人物关系抽取; 社会网络; 树核函数; 结构化信息; 重采样;
D O I
暂无
年度学位
2013
学位类型
硕士
摘要
社会网络研究与分析是计算机领域的热门研究方向之一,而社会网络构建则是其基础。互联网中存在着大量的文本信息,其中蕴含着丰富的人物社会关系,因此从中抽取类型丰富且可靠性高的人物关系对社会网络的研究具有十分重要的意义。本文深入研究了基于树核函数的人物关系抽取方法,并在此基础上构建社会网络,主要研究内容归纳如下: 首先,研究中英文实体关系抽取中的关键技术。提出一种基于近似随机测试技术的显著性测试方法,系统地比较了三种句法分析器和三种结构化信息对基于树核函数的中英文关系抽取性能的影响,并对实验结果作深入的分析,为下一步的人物关系抽取研究提供了基准系统。 其次,探索基于树核函数的人物关系抽取方法。针对人物关系的语言表达形式的特殊性,提出新的结构化信息优化方案;考查语义信息对人物关系抽取性能的贡献;利用重采样技术缓解语料库数据不平衡问题,为社会网络构建打下基础。 最后,研究基于人物关系抽取技术的社会网络构建方法。通过人物关系语料库的标注信息构建标准社会网络,再利用自动获取的人物关系信息构建预测社会网络,并评价预测网络的性能和可信度。同时,从特定网站上挖掘人物活动语料,利用现有技术在真实语言环境中构建社会网络。 在ACE人物关系语料库上的实验表明,本文提出的一系列方法能够有效的提高人物关系抽取的性能;并且该方法可以推广到特定的新闻专题领域,从文本中抽取可靠性高的人物社会关系,进而构造社会网络。
引用
收藏
页数:70
共 9 条
[1]
基于合一句法和实体语义树的中文语义关系抽取 [J].
虞欢欢 ;
钱龙华 ;
周国栋 ;
朱巧明 .
中文信息学报, 2010, (05) :17-23
[2]
一种基于Web的大规模人物社会关系提取方法 [J].
姚从磊 ;
邸楠 .
模式识别与人工智能, 2007, 20 (06) :740-744
[3]
基于核函数中文关系自动抽取系统的实现 [J].
刘克彬 ;
李芳 ;
刘磊 ;
韩颖 .
计算机研究与发展, 2007, (08) :1406-1411
[4]
中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[5]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[6]
信息提取技术概述(上) [J].
孙斌 .
术语标准化与信息技术, 2002, (03) :28-32
[7]
统计学概论.[M].曾五一主编;.首都经济贸易大学出版社.2003,
[8]
同义词词林.[M].梅家驹;竺一鸣;高蕴琦;殷鸿翔 编.上海辞书出版社.1983,
[9]
Flink: Semantic Web technology for the extraction and analysis of social networks.[J].Peter Mika.Web Semantics: Science; Services and Agents on the World Wide Web.2005, 2