基于SUMO和WordNet本体集成的文本分类模型研究

被引:8
作者
胡泽文
王效岳
白如江
机构
[1] 山东理工大学科技信息研究所
关键词
SUMO本体; WordNet; 本体集成; 文本分类模型; 词向量空间; 概念向量空间;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对传统文本分类方法和目前语义分类方法中存在的问题,提出基于SUMO和W ordNet本体集成的文本分类模型,该模型利用W ordNet同义词集与SUMO本体概念之间的映射关系,将文档-词向量空间中的词条映射成本体中相应的概念,形成文档-概念向量空间进行文本自动分类。实验表明,该方法能够极大降低向量空间维度,提高文本分类性能。
引用
收藏
页码:31 / 38
页数:8
相关论文
共 3 条
[1]   一种有效的基于本体的词语-概念映射方法 [J].
李文 ;
陈叶旺 ;
彭鑫 ;
赵文耘 .
计算机科学, 2010, 37 (10) :138-142
[2]   本体集成研究综述 [J].
于娟 ;
党延忠 .
计算机科学, 2008, (07) :9-13+18
[3]   基于WordNet概念向量空间模型的文本分类 [J].
张剑 ;
李春平 .
计算机工程与应用, 2006, (04) :174-178