开放内容中的知识发现——基于WIKIPEDIA链接分析

被引:3
作者
余旸
林漳希
夏国平
机构
[1] 北京航空航天大学经济管理学院
关键词
开放内容; 语义析取; 链接分析; 知识发现;
D O I
暂无
中图分类号
TP182 [专家系统、知识工程];
学科分类号
1111 ;
摘要
作为世界上最大的开放内容工程,Wikipedia仅其英文版本就拥有超过200万的条目数以及超过1亿的内部链接。目前,Wikipedia中的相关内容查询是采用关键词匹配的方法,其中丰富的链接结构所蕴涵大量的相关信息未充分利用。利用Wikipedia中的内部链接关系析取语义关系,进而提高查询的精度。定义了一种新的算法,使用词条"相容率"(Mutual Awareness Ratio)来描述词间距及对知识空间节点(词条)进行相关度的重新排序,从而重新构造知识空间。实验证明,此算法有效地提高了查询精度与用户满意度。
引用
收藏
页码:141 / 144+136 +136
页数:5
相关论文
共 2 条
[1]  
The anatomy of a large-scale hypertextual Web search engine[J] . Sergey Brin,Lawrence Page.Computer Networks and ISDN Systems . 1998 (1)
[2]  
SHAWN:Structure Helps a Wiki Navigate .2 David Aumueller. BTW Workshop WebDB Meets IR . 2005