基于概率推理模型的博客倾向性检索研究

被引:14
作者
廖祥文 [1 ,2 ]
曹冬林 [1 ,2 ]
方滨兴 [1 ]
许洪波 [1 ]
程学旗 [1 ]
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院研究生院
关键词
博客; 倾向性检索; 概率推理模型; 信息检索; 文本挖掘;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
近年来博客作为一种新兴的大众化新闻发布媒介越来越受到人们和业界的关注.博客之间通过互相引用、互相推荐形成一个巨大的博客空间.在博客空间中,人们既可以自由发表对现实生活各种问题的观点,表达自己的情感,也可以对市场上出现的新产品进行评论.准确检索出博客空间中人们对重要话题、热点事件的观点看法对市场调研、网络舆情发现与预警等应用有重要意义.博客倾向性检索的目标是检索出与给定查询既要主题相关又要有与该查询相关评论的博文.为实现该目标,把概率推理模型应用于博客倾向性检索中,提出一个基于概率推理模型的博客倾向性检索算法.该算法把主题相关性评分和倾向性评分合并到一个统一的概率推理理论模型,能够有效计算博文中出现的主题描述与查询的主题相关性,合理度量倾向性词描述查询主题的倾向性强弱,并融合二者分数形成最后整体评分.实验表明,该算法能够有效地识别博客空间中与给定查询相关的观点,获得较好的结果.
引用
收藏
页码:1530 / 1536
页数:7
相关论文
共 1 条
[1]   Blog研究 [J].
杨宇航 ;
赵铁军 ;
于浩 ;
郑德权 .
软件学报, 2008, (04) :912-924