基于中文维基百科的领域概念相关性研究

被引:3
作者
王娟 [1 ]
曹树金 [2 ]
姜灵敏 [1 ]
胡青 [3 ]
机构
[1] 不详
[2] 广东外语外贸大学思科信息学院
[3] 不详
[4] 中山大学资讯管理学院
[5] 大连海事大学信息科学技术学院
[6] 不详
关键词
中文维基百科; 领域概念; 语义相关性; 语义关系;
D O I
10.13266/j.issn.0252-3116.2014.23.021
中图分类号
G254 [文献标引与编目];
学科分类号
摘要
以提高领域概念相关性判断的准确度为研究宗旨,提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法。选取中文维基百科分类体系下的图书情报领域的概念为实验对象,将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法,以及基于文本信息的文本重叠算法进行对比分析。实验结果表明:加权算法能取得更好的效果,可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持。
引用
收藏
页码:136 / 142
页数:7
相关论文
共 7 条
  • [1] 中文维基百科的结构化信息抽取及词语相关度计算方法
    涂新辉
    张红春
    周琨峰
    何婷婷
    [J]. 中文信息学报, 2012, (03) : 109 - 115
  • [2] 基于同义词词林的词语相似度计算方法
    田久乐
    赵蔚
    [J]. 吉林大学学报(信息科学版), 2010, 28 (06) : 602 - 608
  • [3] 基于中文维基百科的语义知识挖掘相关研究[D]. 李赟.北京邮电大学. 2009
  • [4] 基于中文维基百科的语义相关度计算的研究与实现[D]. 汪祥.国防科学技术大学. 2011
  • [5] An analysis of topical coverage of Wikipedia
    Halavais, Alexander
    Lackaff, Derek
    [J]. JOURNAL OF COMPUTER-MEDIATED COMMUNICATION, 2008, 13 (02) : 429 - 440
  • [6] An introduction to latent semantic analysis[J] . Thomas K. Landauer,Peter W. Foltz,Darrell Laham. Discourse Processes . 1998 (2-3)
  • [7] "General Intelligence," Objectively Determined and Measured[J] . The American Journal of Psychology . 1904 (2)