共 9 条
基于本体的文本分类方法
被引:5
作者:
张颖
[1
]
王文杰
[1
]
史忠植
[2
]
机构:
[1] 中国科学院研究生院
[2] 中国科学院计算技术研究所
来源:
基金:
北京市自然科学基金;
关键词:
文本分类;
本体;
模糊数学规划;
多类别多标签;
D O I:
暂无
中图分类号:
TP18 [人工智能理论];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
文本分类是智能科学研究中的重要问题,如何能使分类结果更精确一直是研究的重点。本体技术兴起之后,利用本体作为词典,从而在语义上进行扩展的方法使分类的精确度有了改善。但是,本体自身的结构并没有得到应用,多类别多标签的分类也没有因此得到大幅度改进。作为领域内公认的概念体系,本体自身的结构也是一种非常好的分类标准,为多类别多标签的分类提供了很好的载体。针对多类别多标签分类问题,提出了以本体为类别指导,基于模糊数学规划思想的分类方法。将本体概念作为分类标准,将文本散列到相应的本体概念类别中,并给出其相关程度。实验验证了该方法能够做到更细致的分类结果,改善了多类别多标签分类的能力。此外,该方法还能够改善数据在语义W eb网中的传输效果。
引用
收藏
页码:103 / 106+178
+178
页数:5
相关论文