基于向量空间模型的词共现研究及其在文本分类中的应用

被引:22
作者
吴光远
何丕廉
曹桂宏
聂颂
机构
[1] 天津大学电子信息工程学院
关键词
词共现; 向量空间模型; 互信息; 文本分类; 窗口单元;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文中提出了一种基于向量空间模型的词共现模型算法 ,通过选取整篇文档为窗口单元 ,统计中高频特征词的共现信息 ,改进了模型的效果 ,并将得到的词共现资源应用于文本分类的研究中。实验证明其使分本分类系统的性能得到了一定程度的提高
引用
收藏
页码:138 / 140+145 +145
页数:4
相关论文
共 3 条
  • [1] 一种基于向量空间模型的多层次文本分类方法[J].刘少辉,董明楷,张海俊,李蓉,史忠植. 中文信息学报.2002(03)
  • [2] 一种新颖的词聚类算法和可变长统计语言模型[J].陈浪舟,黄泰翼. 计算机学报.1999(09)
  • [3] 基于向量空间模型的文档分类系统[J].黄萱菁,吴立德. 模式识别与人工智能.1998(02)