共 7 条
向量空间模型中结合句法的文本表示研究
被引:6
作者:
杨玉珍
[1
,2
]
刘培玉
[1
,2
]
姜沛佩
[1
,2
]
机构:
[1] 山东师范大学信息科学与工程学院
[2] 山东省分布式计算机软件新技术重点实验室
来源:
关键词:
特征项;
短语;
句法规则;
关系树;
文本表示;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
为增强向量空间模型(VSM)中项的语义描述性,克服VSM中各语义单元相互独立的缺陷,提出一种基于短语的特征粒度描述方法。该方法从文本的表示及特征项之间的组织方式入手,通过句法规则识别基本短语,构建特征与中心动词的关系树,利用基本短语代替BOW中的词。实验结果表明,采用基本短语的文本表示可提高分类的性能,增加项之间的联系,克服特征项相互独立的缺陷,在特征数量较少的情况下仍能保持良好的分类效果。
引用
收藏
页码:58 / 60
页数:3
相关论文