向量空间模型文本建模的语义增量化改进研究

被引:6
作者
胡吉明
肖璐
机构
[1] 不详
[2] 武汉大学信息资源研究中心
[3] 不详
关键词
文本建模; 语义向量空间模型; 语义增量; 语义相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
【目的】基于语义增量对向量空间模型文本分类方法进行改进,并进行实验验证。【方法】梳理目前文本表示中语义向量引入和改进的相关研究,提出文本的语义向量表示实现框架。根据主题词和词汇分别与领域本体中概念之间的映射关系,构建概念层次树和定位词汇,计算概念语义相似度,结合语义增量实现文本的语义向量构建。【结果】通过文本分类的对比实验发现,本文所提方法可行且有效,在宏平均准确率、宏平均召回率和宏平均F1方面优于其他方法。【局限】在向量空间模型基础上的改进,语义信息的表达不够充分,应继续探索文本建模的真正语义化实现方法;应对多种类型数据进行实验验证,以提高方法的适用性。【结论】探索原始向量空间模型的语义化问题,对当前文本分类及其语义关联等研究具有现实意义。
引用
收藏
页码:49 / 55
页数:7
相关论文
共 13 条
[1]   向量空间模型中结合句法的文本表示研究 [J].
杨玉珍 ;
刘培玉 ;
姜沛佩 .
计算机工程, 2011, 37 (03) :58-60
[2]   语义相似度的计算方法研究与分析 [J].
魏凯斌 ;
冉延平 ;
余牛 .
计算机技术与发展, 2010, 20 (07) :102-105
[3]   基于LDA模型的评论热点挖掘:原理与实现 [J].
余传明 ;
张小青 ;
陈雷 .
情报理论与实践, 2010, 33 (05) :103-106
[4]  
基于领域本体的语义向量空间模型[J]. 唐明伟,卞艺杰,陶飞飞. 情报学报. 2011 (09)
[5]  
Semantic smoothing for text clustering[J] . Jamal A. Nasir,Iraklis Varlamis,Asim Karim,George Tsatsaronis. Knowledge-Based Systems . 2013
[6]  
Assessment of semantic similarity of concepts defined in ontology[J] . Parisa D. Hossein Zadeh,Marek Z. Reformat. Information Sciences . 2013
[7]   A novel semantic information retrieval system based on a three-level domain model [J].
Sbattella, Licia ;
Tedesco, Roberto .
JOURNAL OF SYSTEMS AND SOFTWARE, 2013, 86 (05) :1426-1452
[8]   A semantic similarity method based on information content exploiting multiple ontologies [J].
Sanchez, David ;
Batet, Montserrat .
EXPERT SYSTEMS WITH APPLICATIONS, 2013, 40 (04) :1393-1399
[9]  
Applying VSM and LCS to develop an integrated text retrieval mechanism[J] . Cheng-Shiun Tasi,Yong-Ming Huang,Chien-Hung Liu,Yueh-Min Huang. Expert Systems With Applications . 2011 (4)
[10]   Discovery and evaluation of aggregate usage profiles for web personalization [J].
Mobasher, B ;
Dai, H ;
Luo, T ;
Nakagawa, M .
DATA MINING AND KNOWLEDGE DISCOVERY, 2002, 6 (01) :61-82