一种基于人工策略的WEB信息精确提取系统

被引:2
作者
刘玲
机构
[1] 西南科技大学网络信息中心
关键词
信息提取; 人工策略; DOM;
D O I
暂无
中图分类号
TP319 [专用应用软件];
学科分类号
摘要
如何从海量的WEB信息中提取感兴趣的内容,传统的基于关键字检索的信息提取方法,适用于较为复杂的信息环境。针对特定信息的提取,提出了一种利用DOM树及HTML标签实现大量的特定格式化信息的精确提取方法。实验结果表明,在提取特定WEB信息的应用中达到100%的精确提取率。
引用
收藏
页码:49 / 52
页数:4
相关论文
共 2 条
  • [1] 网络蜘蛛搜索策略比较研究
    李学勇
    欧阳柳波
    李国徽
    钟敏娟
    [J]. 计算机工程与应用, 2004, (04) : 128 - 131
  • [2] 网络机器人Java编程指南.[M].(美)JeffHeaton著;童兆丰等译;.电子工业出版社.2002,