从社会性标签中进行语义关系抽取——一种元数据生成方法

被引:10
作者
崔晓莉
机构
[1] 美国雪城大学
[2] 华东师范大学信息学系
关键词
关系抽取; 标签; 搜索引擎; 社会性语义; 元数据;
D O I
暂无
中图分类号
G354 [情报检索];
学科分类号
120502 [情报学];
摘要
标签形式的社会性语义越来越占据主导地位,使元数据界在这种新形式的信息内容表达和检索方面面临机遇和挑战。其中,主要的挑战是与标签相关的语境信息的缺失。以Flickr标签为例,对如何利用社会性语义资源来丰富主题元数据进行了实验。实验过程包含4个步骤:收集Flickr标签样本;通过共有信息计算标签间的同现情况;通过Google检索结果来追踪标签对的语境信息;用自然语言处理和机器学习技术来抽取标签间的语义关系。本实验能够利用Google搜索结果构建语境库,并且以自然语言处理和机器学习算法对这些语句进行处理。这种新方法对于赋予标签对以一定语义关系有相当高的准确率。也探讨该方法在利用社会性语义丰富的主题元数据方面的意义。
引用
收藏
页码:38 / 45
页数:8
相关论文
共 1 条
[1]
Relation Extraction for Mining the Semantic Web Iria;Jose;Fabio Ciravegna; Dagstuhl Seminar on Machine Learning for the Semantic Web 2005,