基于向量模型的文本检索若干问题研究

被引:13
作者
刘海峰 [1 ]
王元元 [2 ]
机构
[1] 不详
[2] 解放军理工大学理学院
[3] 不详
[4] 解放军理工大学指挥自动化学院
[5] 不详
关键词
向量空间模型; 分词; 样本方差; 相似度; 奇异值分解; 文本检索;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
针对向量空间模型存在的几个问题进行了研究和探讨。在文本切分上提出了一种基于方差的切词方法;在对TF-IDF因子改进方面提出了位置参数加权方式;对向量维数压缩、词语同现等问题方面总结了解决的方法。
引用
收藏
页码:57 / 59+62 +62
页数:4
相关论文
共 4 条
  • [1] 现代信息检索[M]. 机械工业出版社 , ()RicardoBaeza-Yates,()BerthierRibeiro-Neto等著, 2005
  • [2] 统计自然语言处理基础[M]. 电子工业出版社 , (美)ChristopherD.Manning,(德)HinrichSchutze著, 2005
  • [3] 计算语言学[M]. 清华大学出版社 , 刘颖编著, 2002
  • [4] 语法研究入门[M]. 商务印书馆 , 吕叔湘等著, 1999