学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于向量空间模型的改进文本分类算法
被引:14
作者
:
牛玲
论文数:
0
引用数:
0
h-index:
0
机构:
亳州师范高等专科学校
牛玲
机构
:
[1]
亳州师范高等专科学校
来源
:
情报杂志
|
2006年
/ 06期
关键词
:
向量空间模型;
文本分类;
信息检索;
潜在语义索引;
核潜在语义索引;
D O I
:
暂无
中图分类号
:
G354 [情报检索];
学科分类号
:
120502
[情报学]
;
摘要
:
探讨了基于向量空间模型的文本分类技术,通过规范化向量空间模型术语,论述了向量空间模型中TD-IDF向量化文档的不足;提出基于位置等因素的权重改进算法;借助扩展的潜在语义索引算法KLSC和辅助主题词表来消除模型很难处理一词多义、一义多词的现象;根据用户个性化的服务需求,给出了个性化服务的意见。
引用
收藏
页码:63 / 64+67 +67
页数:3
相关论文
共 2 条
[1]
基于潜在语义的多类文本分类模型研究[J] 叶浩;王明文;曾雪强 清华大学学报(自然科学版) 2005, S1
[2]
一个基于向量空间模型的中文文本自动分类系统
[J].
朱华宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
朱华宇
;
孙正兴
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
孙正兴
;
张福炎
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
张福炎
.
计算机工程,
2001,
(02)
:15
-17+63
←
1
→
共 2 条
[1]
基于潜在语义的多类文本分类模型研究[J] 叶浩;王明文;曾雪强 清华大学学报(自然科学版) 2005, S1
[2]
一个基于向量空间模型的中文文本自动分类系统
[J].
朱华宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
朱华宇
;
孙正兴
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
孙正兴
;
张福炎
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
张福炎
.
计算机工程,
2001,
(02)
:15
-17+63
←
1
→