学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
水利垂直搜索引擎的研究
被引:5
作者
:
论文数:
引用数:
h-index:
机构:
周远超
[
1
]
论文数:
引用数:
h-index:
机构:
叶枫
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
高依旻
[
3
]
论文数:
引用数:
h-index:
机构:
张雪洁
[
1
,
2
]
机构
:
[1]
河海大学计算机与信息学院
[2]
南京航空航天大学计算机科学与技术学院
[3]
河海大学图书馆
来源
:
计算机与数字工程
|
2012年
/ 40卷
/ 10期
关键词
:
云平台;
垂直搜索引擎;
齐普夫定律;
布拉德福定律;
D O I
:
暂无
中图分类号
:
TP391.3 [检索机];
学科分类号
:
080201
[机械制造及其自动化]
;
摘要
:
水利信息资源的种类、内容多,专业性强,而且分布散乱,难以检索。论文结合水利领域的特定需求,提出了一个基于云平台的水利垂直搜索引擎—Water-Searcher,以期为水利领域的工作者提供一个能及时、全面、系统地了解水利领域信息资源的平台。具体内容包括建立水利种子站点列表,构建水利领域词典和领域停用词典,筛选出水利核心网站,结合已有的云平台实现分布式搜索。根据实验分析结果和专家认定机制,Water-Searcher能为水利工作者提供更好的专业化检索服务。
引用
收藏
页码:64 / 66+115 +115
页数:4
相关论文
共 13 条
[1]
开发自己的搜索引擎.[M].邱哲; 符滔滔; 编著.人民邮电出版社.2007,
[2]
网络爬虫的优化策略探略
[J].
论文数:
引用数:
h-index:
机构:
李志义
.
现代情报,
2011,
31
(10)
:31
-35
[3]
有效HTML文本信息抽取方法的研究
[J].
论文数:
引用数:
h-index:
机构:
韩忠明
;
论文数:
引用数:
h-index:
机构:
李文正
;
论文数:
引用数:
h-index:
机构:
莫倩
.
计算机应用研究,
2008,
25
(12)
:3568
-3571+3574
[4]
一种高效的倒排索引存储结构
[J].
论文数:
引用数:
h-index:
机构:
邓攀
;
论文数:
引用数:
h-index:
机构:
刘功申
.
计算机工程与应用,
2008,
(31)
:149
-152
[5]
WNBTE网页正文抽取方法研究
[J].
论文数:
引用数:
h-index:
机构:
李纲
;
论文数:
引用数:
h-index:
机构:
戴强斌
.
情报科学 ,
2008,
(03)
:333
-336
[6]
主题搜索引擎中网络爬虫的搜索策略研究
[J].
论文数:
引用数:
h-index:
机构:
李勇
;
论文数:
引用数:
h-index:
机构:
韩亮
.
计算机工程与科学,
2008,
(03)
:4
-6+56
[7]
水利及其相关行业部分外文信息的检索
[J].
郎忘忧
论文数:
0
引用数:
0
h-index:
0
机构:
浙江省水利河口研究院
浙江省水利河口研究院
郎忘忧
;
论文数:
引用数:
h-index:
机构:
戚莹
.
浙江水利科技,
2007,
(05)
:76
-77+84
[8]
垂直搜索引擎发展概述
[J].
论文数:
引用数:
h-index:
机构:
罗丽姗
.
图书馆学研究,
2006,
(12)
:68
-70+55
[9]
面向信息检索的自适应中文分词系统
[J].
曹勇刚
论文数:
0
引用数:
0
h-index:
0
机构:
北京航空航天大学计算机学院
曹勇刚
;
曹羽中
论文数:
0
引用数:
0
h-index:
0
机构:
北京航空航天大学计算机学院
曹羽中
;
论文数:
引用数:
h-index:
机构:
金茂忠
;
论文数:
引用数:
h-index:
机构:
刘超
.
软件学报,
2006,
(03)
:356
-363
[10]
一种中文分词词典新机制——双字哈希机制
[J].
李庆虎
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
李庆虎
;
陈玉健
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
陈玉健
;
孙家广
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
孙家广
.
中文信息学报,
2003,
(04)
:13
-18
←
1
2
→
共 13 条
[1]
开发自己的搜索引擎.[M].邱哲; 符滔滔; 编著.人民邮电出版社.2007,
[2]
网络爬虫的优化策略探略
[J].
论文数:
引用数:
h-index:
机构:
李志义
.
现代情报,
2011,
31
(10)
:31
-35
[3]
有效HTML文本信息抽取方法的研究
[J].
论文数:
引用数:
h-index:
机构:
韩忠明
;
论文数:
引用数:
h-index:
机构:
李文正
;
论文数:
引用数:
h-index:
机构:
莫倩
.
计算机应用研究,
2008,
25
(12)
:3568
-3571+3574
[4]
一种高效的倒排索引存储结构
[J].
论文数:
引用数:
h-index:
机构:
邓攀
;
论文数:
引用数:
h-index:
机构:
刘功申
.
计算机工程与应用,
2008,
(31)
:149
-152
[5]
WNBTE网页正文抽取方法研究
[J].
论文数:
引用数:
h-index:
机构:
李纲
;
论文数:
引用数:
h-index:
机构:
戴强斌
.
情报科学 ,
2008,
(03)
:333
-336
[6]
主题搜索引擎中网络爬虫的搜索策略研究
[J].
论文数:
引用数:
h-index:
机构:
李勇
;
论文数:
引用数:
h-index:
机构:
韩亮
.
计算机工程与科学,
2008,
(03)
:4
-6+56
[7]
水利及其相关行业部分外文信息的检索
[J].
郎忘忧
论文数:
0
引用数:
0
h-index:
0
机构:
浙江省水利河口研究院
浙江省水利河口研究院
郎忘忧
;
论文数:
引用数:
h-index:
机构:
戚莹
.
浙江水利科技,
2007,
(05)
:76
-77+84
[8]
垂直搜索引擎发展概述
[J].
论文数:
引用数:
h-index:
机构:
罗丽姗
.
图书馆学研究,
2006,
(12)
:68
-70+55
[9]
面向信息检索的自适应中文分词系统
[J].
曹勇刚
论文数:
0
引用数:
0
h-index:
0
机构:
北京航空航天大学计算机学院
曹勇刚
;
曹羽中
论文数:
0
引用数:
0
h-index:
0
机构:
北京航空航天大学计算机学院
曹羽中
;
论文数:
引用数:
h-index:
机构:
金茂忠
;
论文数:
引用数:
h-index:
机构:
刘超
.
软件学报,
2006,
(03)
:356
-363
[10]
一种中文分词词典新机制——双字哈希机制
[J].
李庆虎
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
李庆虎
;
陈玉健
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
陈玉健
;
孙家广
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
孙家广
.
中文信息学报,
2003,
(04)
:13
-18
←
1
2
→