学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种基于人工策略的WEB信息精确提取系统
被引:2
作者
:
刘玲
论文数:
0
引用数:
0
h-index:
0
机构:
西南科技大学网络信息中心
刘玲
机构
:
[1]
西南科技大学网络信息中心
来源
:
西南科技大学学报
|
2009年
/ 24卷
/ 02期
关键词
:
信息提取;
人工策略;
DOM;
D O I
:
暂无
中图分类号
:
TP319 [专用应用软件];
学科分类号
:
摘要
:
如何从海量的WEB信息中提取感兴趣的内容,传统的基于关键字检索的信息提取方法,适用于较为复杂的信息环境。针对特定信息的提取,提出了一种利用DOM树及HTML标签实现大量的特定格式化信息的精确提取方法。实验结果表明,在提取特定WEB信息的应用中达到100%的精确提取率。
引用
收藏
页码:49 / 52
页数:4
相关论文
共 2 条
[1]
网络蜘蛛搜索策略比较研究
李学勇
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
李学勇
欧阳柳波
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
欧阳柳波
李国徽
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
李国徽
钟敏娟
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
钟敏娟
[J].
计算机工程与应用,
2004,
(04)
: 128
-
131
[2]
网络机器人Java编程指南.[M].(美)JeffHeaton著;童兆丰等译;.电子工业出版社.2002,
←
1
→
共 2 条
[1]
网络蜘蛛搜索策略比较研究
李学勇
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
李学勇
欧阳柳波
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
欧阳柳波
李国徽
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
李国徽
钟敏娟
论文数:
0
引用数:
0
h-index:
0
机构:
长沙大学数学与信息科学系
钟敏娟
[J].
计算机工程与应用,
2004,
(04)
: 128
-
131
[2]
网络机器人Java编程指南.[M].(美)JeffHeaton著;童兆丰等译;.电子工业出版社.2002,
←
1
→