共 4 条
一种基于网页分割的Web信息检索方法
被引:2
作者:
俞扬信
严云洋
机构:
[1] 淮阴工学院计算机工程系
来源:
关键词:
网页分割;
信息检索;
HTML标记;
相似性;
D O I:
暂无
中图分类号:
TP391.3 [检索机];
学科分类号:
摘要:
提出一种基于网页内容分割的Web信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合。在检索和排序中,根据用户的查询,充分利用区域信息来对相关的检索结果进行排序。
引用
收藏
页码:108 / 110+114
+114
页数:4
相关论文