一种基于Web的大规模人物社会关系提取方法

被引:12
作者
姚从磊
邸楠
机构
[1] 北京大学网络与分布式系统实验室
关键词
人物社会关系; 描述模式; 关系提取; 模拟退火;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP393.09 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 080402 ;
摘要
Web 上的人物社会关系是一类重要的 Web 信息.本文提出一种轻量级的大规模人物社会关系提取方法,并引入模拟退火方法,迭代发掘网页中蕴涵的表述人物社会关系的最小描述模式集合.利用 Web 信息冗余性,高效准确地从 Web 上提取人物关系信息.为验证本文方法的有效性,定义6种人物社会关系,基于1张大规模 Web人名列表,对这6种关系进行提取.实验结果表明本文方法的平均准确率为84.79%,平均召回率为81.69%.
引用
收藏
页码:740 / 744
页数:5
相关论文
共 3 条
[1]   基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[2]   对中国曾有过静态网页数的一种估计 [J].
李晓明 .
北京大学学报(自然科学版), 2003, (03) :394-398
[3]   中文人名自动识别的一种有效方法 [J].
李建华 ;
王晓龙 .
高技术通讯, 2000, (02) :49-52