共 3 条
基于SUMO和WordNet本体集成的文本分类模型研究
被引:8
作者:
胡泽文
王效岳
白如江
机构:
[1] 山东理工大学科技信息研究所
来源:
关键词:
SUMO本体;
WordNet;
本体集成;
文本分类模型;
词向量空间;
概念向量空间;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和W ordNet本体集成的文本分类模型,该模型利用W ordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。
引用
收藏
页码:31 / 38
页数:8
相关论文