融合文本概念化与网络表示的观点检索

被引:10
作者
廖祥文 [1 ,2 ]
刘德元 [1 ,2 ]
桂林 [1 ,2 ]
程学旗 [3 ]
陈国龙 [1 ,2 ]
机构
[1] 福州大学数学与计算机科学学院
[2] 福建省网络计算与智能信息处理重点实验室(福州大学)
[3] 网络数据科学与技术重点实验室(中国科学院)
关键词
信息检索; 观点检索; 知识图谱; 文本概念化; 网络表示;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
观点检索是自然语言处理领域中的一个热点研究课题.现有的观点检索模型在检索过程中往往无法根据上下文将词汇进行知识、概念层面的抽象,在语义层面忽略词汇之间的语义联系,观点层面缺乏观点泛化能力.因此,提出一种融合文本概念化与网络表示的观点检索方法.该方法首先利用知识图谱分别将用户查询和文本概念化到正确的概念空间,并利用网络表示将知识图谱中的词汇节点表示成低维向量,然后根据词向量推出查询和文本的向量,并用余弦公式计算用户查询与文本的相关度,接着引入基于统计机器学习的分类方法挖掘文本的观点.最后,利用概念空间、网络表示空间以及观点分析结果构建特征,并服务于观点检索模型.相关实验结果表明,所提出的检索模型可以有效提高多种检索模型的观点检索性能.其中,基于统一相关模型的观点检索方法在两个实验数据集上相比于基准方法,在MAP评价指标上分别提升了6.1%和9.3%,基于排序学习的观点检索方法在两个实验数据集上相比于基准方法,在MAP评价指标上分别提升了2.3%和14.6%.
引用
收藏
页码:2899 / 2914
页数:16
相关论文
共 8 条
[1]
基于知识图谱的文本观点检索方法 [J].
马飞翔 ;
廖祥文 ;
於志勇 ;
吴运兵 ;
陈国龙 .
山东大学学报(理学版), 2016, 51 (11) :33-40
[2]
短文本理解研究 [J].
王仲远 ;
程健鹏 ;
王海勋 ;
文继荣 .
计算机研究与发展, 2016, (02) :262-269
[3]
知识表示学习研究进展 [J].
刘知远 ;
孙茂松 ;
林衍凯 ;
谢若冰 .
计算机研究与发展, 2016, 53 (02) :247-261
[4]
知识库实体对齐技术综述 [J].
庄严 ;
李国良 ;
冯建华 .
计算机研究与发展, 2016, (01) :165-192
[5]
形式概念分析在不完备信息系统中的知识获取 [J].
李想 ;
王素格 ;
李德玉 ;
康向平 ;
翟岩慧 .
计算机科学, 2014, 41 (07) :250-253+260
[6]
An effective approach to tweets opinion retrieval.[J].Zhunchen Luo;Miles Osborne;Ting Wang.World Wide Web.2015, 3
[7]
Incremental entropy-based clustering on categorical data streams with concept drift.[J].Yanhong Li;Deyu Li;Suge Wang;Yanhui Zhai.Knowledge-Based Systems.2014,
[8]
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11