基于学术社区的学术搜索引擎设计

被引:13
作者
陈国华 [1 ]
汤庸 [2 ]
彭泽武 [1 ]
李建国 [2 ]
机构
[1] 中山大学信息科学与技术学院
[2] 华南师范大学计算机学院
关键词
学术社区; 学术搜索引擎; 文献整合算法; 中文姓名分词;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
学术社区和学术搜索引擎在科研活动中日趋重要。给出了一个基于学术社区的学术搜索引擎的设计方案,指出了它应具备的功能,提出了应着重解决的关键问题,并对部分问题提出了实现思路。给出了系统的架构设计,并讨论了文献资料的整合算法,将分散在不同位置、提供不同内容的学术信息组合为一个整体,有效地解决了文献提取问题。针对普通中文分词组件在对姓名进行分词时准确率较低的问题,设计了一个专门针对姓名进行分词的高效的算法。在开源框架Nutch和HBase的基础上,实现了一个学术搜索引擎,并在实验中验证了设计的有效性。
引用
收藏
页码:171 / 175
页数:5
相关论文
共 2 条
[1]   一种基于语义及统计分析的Deep Web实体识别机制 [J].
寇月 ;
申德荣 ;
李冬 ;
聂铁铮 .
软件学报, 2008, (02) :194-208
[2]  
Selective Re-crawling for Object-Level Vertical Search .2 Zhou Ya-qian,Jiang Meng-jing,Zhang Qi,et al. Proceedings ofthe 19th International Conference on World Wide Web(WWW2010) . 2010