共 3 条
基于HTML或MXL描述的Web页信息抽取技术研究
被引:2
作者:
谢维成
吕先竞
宋玉忠
不详
机构:
[1] 西华大学电气信息学院
[2] 西华大学图书馆
[3] 西华大学图书馆 四川成都
[4] 四川成都
来源:
关键词:
Web;
企业信息挖掘;
HTML;
XML;
数据抽取;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。
引用
收藏
页码:1398 / 1402
页数:5
相关论文