学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Lucene的中文倒排索引技术的研究
被引:49
作者
:
论文数:
引用数:
h-index:
机构:
郑榕增
林世平
论文数:
0
引用数:
0
h-index:
0
机构:
福州大学数学与计算机科学学院
林世平
机构
:
[1]
福州大学数学与计算机科学学院
来源
:
计算机技术与发展
|
2010年
/ 20卷
/ 03期
关键词
:
全文检索;
倒排索引;
索引压缩;
Lucene;
D O I
:
暂无
中图分类号
:
TP391.3 [检索机];
学科分类号
:
摘要
:
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。
引用
收藏
页码:80 / 83
页数:4
相关论文
共 6 条
[1]
一种高效的倒排索引存储结构
论文数:
引用数:
h-index:
机构:
邓攀
刘功申
论文数:
0
引用数:
0
h-index:
0
机构:
不详
刘功申
[J].
计算机工程与应用 ,
2008,
(31)
: 149
-
152
[2]
基于Lucene的中文字典分词模块的设计与实现
论文数:
引用数:
h-index:
机构:
向晖
论文数:
引用数:
h-index:
机构:
郭一平
论文数:
引用数:
h-index:
机构:
王亮
[J].
现代图书情报技术,
2006,
(08)
: 46
-
50
[3]
搜索引擎倒排文件的一种分块组织技术
彭波
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
彭波
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
李晓明
[J].
电子学报,
2005,
(02)
: 358
-
362
[4]
全文索引的研究
徐小刚
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系
徐小刚
王俊杰
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系
王俊杰
论文数:
引用数:
h-index:
机构:
于玉
[J].
计算机工程,
2002,
(02)
: 101
-
103
[5]
一种全新的全文索引模型——后继数组模型
刘学文
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
刘学文
陶晓鹏
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
陶晓鹏
于玉
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
于玉
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
胡运发
[J].
软件学报,
2002,
(01)
: 150
-
158
[6]
Lucene in action. Gospodnetic O,Hatcher E. Manning Publications . 2004
←
1
→
共 6 条
[1]
一种高效的倒排索引存储结构
论文数:
引用数:
h-index:
机构:
邓攀
刘功申
论文数:
0
引用数:
0
h-index:
0
机构:
不详
刘功申
[J].
计算机工程与应用 ,
2008,
(31)
: 149
-
152
[2]
基于Lucene的中文字典分词模块的设计与实现
论文数:
引用数:
h-index:
机构:
向晖
论文数:
引用数:
h-index:
机构:
郭一平
论文数:
引用数:
h-index:
机构:
王亮
[J].
现代图书情报技术,
2006,
(08)
: 46
-
50
[3]
搜索引擎倒排文件的一种分块组织技术
彭波
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
彭波
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
李晓明
[J].
电子学报,
2005,
(02)
: 358
-
362
[4]
全文索引的研究
徐小刚
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系
徐小刚
王俊杰
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系
王俊杰
论文数:
引用数:
h-index:
机构:
于玉
[J].
计算机工程,
2002,
(02)
: 101
-
103
[5]
一种全新的全文索引模型——后继数组模型
刘学文
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
刘学文
陶晓鹏
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
陶晓鹏
于玉
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
于玉
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学
胡运发
[J].
软件学报,
2002,
(01)
: 150
-
158
[6]
Lucene in action. Gospodnetic O,Hatcher E. Manning Publications . 2004
←
1
→