一种基于网页分割的Web信息检索方法

被引:2
作者
俞扬信
严云洋
机构
[1] 淮阴工学院计算机工程系
关键词
网页分割; 信息检索; HTML标记; 相似性;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
提出一种基于网页内容分割的Web信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合。在检索和排序中,根据用户的查询,充分利用区域信息来对相关的检索结果进行排序。
引用
收藏
页码:108 / 110+114 +114
页数:4
相关论文
共 4 条
[1]   基于知识推理的语义信息检索研究 [J].
俞扬信 .
情报杂志 , 2008, (11) :78-80
[2]   一种基于最大权匹配计算的信息检索方法 [J].
朱征宇 ;
苑昆峰 ;
陈杏环 .
计算机工程与应用, 2007, (33) :176-179
[3]   基于链接结构分析的Web信息检索方法研究 [J].
宋玲玲 ;
李村合 .
现代情报, 2007, (02) :133-135+137
[4]   一种基于加权语义相似度模型的自动问答系统 [J].
刘亚军 ;
徐易 .
东南大学学报(自然科学版), 2004, (05) :609-612