基于语义理解的智能搜索引擎研究

被引:12
作者
陈林
杨丹
赵俊芹
机构
[1] 重庆大学软件学院
关键词
自然语言处理; 分词; 语义分析; 向量空间模型;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
本文提出了一种基于自然语言理解的搜索引擎模型。它的核心技术是基于自然语言理解的相关技术,包括从关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向Web网页内容的特征库,提出返回文档排序的算法,基于Lucene全文索引工具包建立了搜索引擎,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。
引用
收藏
页码:152 / 154
页数:3
相关论文
共 5 条
[1]   中文交互式网络搜索引擎及其自学习能力 [J].
杜阿宁 ;
方滨兴 ;
胡铭曾 ;
云晓春 ;
不详 .
计算机工程与应用 , 2003, (10) :148-150+212
[2]   基于《知网》的中文信息结构抽取研究 [J].
尤昉 ;
李涓子 ;
王作英 ;
不详 .
计算机工程与应用 , 2002, (18) :56-58
[3]   构建知网关系的网状表示 [J].
周强 ;
冯松岩 .
中文信息学报, 2000, (06) :21-27
[4]  
计算语言学.[M].刘颖编著;.清华大学出版社.2002,
[5]  
Chinese word segmentation and its effect on information retrieval.[J].Schubert Foo;Hui Li.Information Processing and Management.2002, 1