基于自动语义标注和集成学习的Web服务分类

被引:8
作者
李元杰
曹健
胡亮
机构
[1] 上海交通大学计算机科学与工程系协同计算与智能技术实验室
关键词
WSDL; 自然语言处理; 本体匹配; 集成学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.09 [];
学科分类号
120506 [数字人文];
摘要
随着Web服务技术的发展,它们在互联网上发布的数量正在快速增长,智能地去识别每个Web服务成为了高效运用网络的关键,而识别Web服务的第一步就是对它们进行准确地分类.于是对海量的Web服务进行分类成为一项工作量庞大的任务.于是,为了能够更有效的利用这些Web服务,需要自动对Web服务进行分类.本文以常见的WSDL为例进行研究,由于Web服务的描述采用了WSDL文件,使之无法用传统的文本分类手段.该文中介绍了一种将WSDL文件处理后通过本体匹配进行自动的语义标注,运用Nave Bayes、SVM、REPTree三种分类方法,进而运用集成学习进行分类的方法,在951个Web服务集合上进行19个类别的分类实验中,其准确率达到了87.39%.
引用
收藏
页码:23 / 28
页数:6
相关论文
共 1 条
[1]
BoosTexter: A boosting-based system for text categorization [J].
Schapire, RE ;
Singer, Y .
MACHINE LEARNING, 2000, 39 (2-3) :135-168