一种基于词典的搜索引擎系统动态更新模型

被引:13
作者
雷鸣
刘建国
王建勇
陈葆珏
机构
[1] 北京大学计算机科学技术系!北京,北京大学计算机科学技术系!北京,北京大学计算机科学技术系!北京,北京大学计算机科学技术系!北京
关键词
搜索引擎; 自然语言处理; 中文信息处理; 万维网;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
基于词汇标注的特征项提取方法是中文信息处理的有效方法 ,但词汇的析取是基于词典的 ,词典的涵盖程度决定了词汇切分的准确率 .因而不断地学习新词汇、动态地维护词典 ,使整个中文信息处理系统具有自适应性和动态性就成了一个关键问题 .以搜索引擎系统为例 ,提出了一种基于词典动态变化的搜索引擎系统更新理论模型和实现模型 .相关实验表明 ,该模型对缩短搜索引擎信息库的更新时间、提高查询准确率等方面十分有效
引用
收藏
页码:1265 / 1270
页数:6
相关论文
共 2 条
[1]   基于向量空间模型的文档分类系统 [J].
黄萱菁 ;
吴立德 .
模式识别与人工智能, 1998, 11 (02) :147-153
[2]  
Salton,G.,McGill,M.J. Introduction to Modern Information Retrieval . 1983