开源全文检索引擎Lucene本地化实践研究

被引:8
作者
吴鹏飞 [1 ]
马凤娟 [2 ]
李文革 [1 ]
郭鹏 [1 ]
机构
[1] 石家庄学院图书馆
[2] 石家庄经济学院人文与社科学院
关键词
全文检索; Lucene语言分析器; 数字图书馆; 开源;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
对开源全文检索引擎Lucene的系统架构、索引与检索过程、语言分析器进行分析的基础上,针对其对中文只能进行单字切分、双字切分的不足,二次开发基于Lucene中英文语言分析器ZHCNAnalyzer,并给出一个调用此分析器建立索引与检索的实例。
引用
收藏
页码:19 / 22
页数:4
相关论文
共 4 条
[1]   基于Lucene的中文文本分词 [J].
王继明 ;
杨国林 .
内蒙古工业大学学报(自然科学版), 2007, (03) :185-188
[2]   基于Lucene的中文字典分词模块的设计与实现 [J].
向晖 ;
郭一平 ;
王亮 .
现代图书情报技术, 2006, (08) :46-50
[3]   一种中文分词词典新机制——双字哈希机制 [J].
李庆虎 ;
陈玉健 ;
孙家广 .
中文信息学报, 2003, (04) :13-18
[4]   全二分最大匹配快速分词算法 [J].
李振星 ;
徐泽平 ;
唐卫清 ;
唐荣锡 .
计算机工程与应用, 2002, (11) :106-109