一种高效的用于文本聚类的无监督特征选择算法

被引:39
作者
刘涛
吴功宜
陈正
机构
[1] 南开大学信息技术科学学院
[2] 微软亚洲研究院
关键词
特征选择; 文本聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
特征选择虽然非常成功地应用于文本分类,但却很少用于文本聚类,这是因为那些高效的特征选择方法通常都是有监督的特征选择算法,它们因为需要类信息而无法直接应用于文本聚类.为了能将这些方法应用到文本聚类上,提出了一种新的无监督特征选择算法:基于K-Means的特征选择算法(KFS).这个算法通过在不同K-Means聚类结果上使用有监督特征选择的方法,成功地选择出了最为重要的一小部分特征,使文本聚类的性能提高了近15%.
引用
收藏
页码:381 / 386
页数:6
相关论文
共 1 条
  • [1] 向量空间法中单词权重函数的分析和构造
    陆玉昌
    鲁明羽
    李凡
    周立柱
    [J]. 计算机研究与发展, 2002, (10) : 1205 - 1210