Deep Web查询接口的自动判定

被引:48
作者
高岭
赵朋朋
崔志明
机构
[1] 苏州大学智能信息处理及应用研究所
关键词
深网; 网页表单; 特征提取; 朴素贝叶斯分类;
D O I
暂无
中图分类号
TP311.10 [];
学科分类号
摘要
传统搜索引擎仅可以索引浅层Web页面,然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性。
引用
收藏
页码:148 / 151
页数:4
相关论文
empty
未找到相关数据