基于HTML或MXL描述的Web页信息抽取技术研究

被引:2
作者
谢维成
吕先竞
宋玉忠
不详
机构
[1] 西华大学电气信息学院
[2] 西华大学图书馆
[3] 西华大学图书馆 四川成都
[4] 四川成都
关键词
Web; 企业信息挖掘; HTML; XML; 数据抽取;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。
引用
收藏
页码:1398 / 1402
页数:5
相关论文
共 3 条
[1]   南京市制造业企业信息系统实施现状及可行性研究 [J].
许龄艺 ;
徐小丽 ;
不详 .
情报科学 , 2004, (07) :884-888
[2]   基于多层次数据库的智能Web挖掘系统 [J].
李长河 ;
王维花 ;
张二虎 .
计算机工程, 2004, (05) :93-94+101
[3]   从WEB文档中构造半结构化信息的抽取器 [J].
黄豫清 ;
戚广志 ;
张福炎 .
软件学报, 2000, (01) :73-78