企业级搜索引擎技术在博客网站中的应用

被引:1
作者
张雪燕 [1 ]
杨晟刚 [2 ]
黄文 [1 ]
冯姚震 [1 ]
机构
[1] 宁波广播电视大学信息技术系
[2] 燕山大学工业计算机控制工程河北省重点实验室
关键词
企业级搜索引擎; 网页等级; 网络爬虫; 查全率; 博客;
D O I
10.16208/j.issn1000-7024.2008.18.038
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
随着网络技术的发展和广泛应用,安全的监控网站内容已成为研究的热点之一。根据博客网站体系结构的特点,提出采用企业级搜索引擎技术监控其内容的方法,将索引词库中的词条与非法关键字表进行比较,及时发现非法数据,然后通过审查程序发送信息给管理人员,从而能及时处理问题网页,达到实时和有效的个性化监控,极大地减轻了管理人员的工作负荷。测试实验结果表明,该系统在保证查全率和查准率的基础上,提高了搜索效率并满足了对网站内容的监控要求。
引用
收藏
页码:4856 / 4858+4861 +4861
页数:4
相关论文
共 3 条
[1]   GOOGLE搜索引擎PageRank技术的优化 [J].
阎放 ;
张海涛 ;
朱宏谊 .
情报科学, 2002, (12) :1333-1335
[2]   Google的PageRank技术剖析 [J].
曹军 .
情报杂志 , 2002, (10) :15-18
[3]  
Toward a unified approach to statistical language modeling for Chinese[J] . Jianfeng Gao,Joshua Goodman,Mingjing Li,Kai-Fu Lee.ACM Transactions on Asian Language Information Processing (TALIP) . 2002 (1)