基于主题的自适应、在线网络热点发现方法及新闻推荐系统

被引:29
作者
吴永辉 [1 ,2 ]
王晓龙 [1 ,2 ]
丁宇新 [3 ]
徐军 [3 ]
郭鸿志 [3 ]
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 哈尔滨工业大学深圳研究生院,深圳市网络环境智能计算重点实验室
[3] 哈尔滨工业大学深圳研究生院深圳市网络环境智能计算重点实验室
关键词
知识服务; 主题发现; 增量; 自适应; LDA模型; 仿射传播聚类;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
本文提出了一种基于改进HotRank算法的站点排序及种子URL选择方法,建立了在线主题发现系统信息采集自适应增量更新模型;结合LDA模型和仿射传播聚类算法(AP),提出了一种网络主题发现和热点新闻推荐方法,并在海天园知识服务平台热点新闻推荐系统中得到了应用.
引用
收藏
页码:2620 / 2624
页数:5
相关论文
共 7 条
[1]   基于主题分析的文本分割技术研究 [J].
刘铭 ;
王晓龙 ;
刘远超 .
电子学报, 2009, 37 (02) :278-284
[2]   基于近邻传播算法的半监督聚类 [J].
肖宇 ;
于剑 .
软件学报, 2008, (11) :2803-2813
[3]   基于LDA模型的文本分割 [J].
石晶 ;
胡明 ;
石鑫 ;
戴国忠 .
计算机学报, 2008, (10) :1865-1873
[4]   搜索引擎中信息动态采集策略的研究 [J].
高凯 .
电子学报, 2007, (10) :1984-1988
[5]   网页变化与增量搜集技术 [J].
孟涛 ;
王继民 ;
闫宏飞 .
软件学报, 2006, (05) :1051-1067
[6]   Architectural design and evaluation of an efficient Web-crawling system [J].
Yan, HF ;
Wang, JY ;
Li, XM ;
Guo, L .
JOURNAL OF SYSTEMS AND SOFTWARE, 2002, 60 (03) :185-193
[7]  
Mercator: A scalable, extensible Web crawler[J] . Allan Heydon,Marc Najork.World Wide Web . 1999 (4)