一种基于栈结构的HTML到XML的转换方法

被引:12
作者
吴相智
刘卫国
费洪晓
机构
[1] 中南大学信息科学与工程学院,中南大学信息科学与工程学院,中南大学信息科学与工程学院湖南长沙 ,湖南长沙 ,湖南长沙
关键词
HTML; XML; 栈; 信息抽取;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
当前Web信息大多数都是HTML格式,对其数据进行抽取,从而达到重用是一个研究重点。提出了一种基于栈结构的将HTML页面转换成XML格式的方法,简化了HTML中的信息抽取问题。
引用
收藏
页码:64 / 67
页数:4
相关论文
共 2 条
[1]
XML理论和应用基础.[M].孙一中编著;.北京邮电大学出版社.2000,
[2]
数据结构.[M].严蔚敏;吴伟民编著;.清华大学出版社.1987,