一种基于k最近邻的快速文本分类方法

被引:13
作者
张庆国
张宏伟
张君玉
机构
[1] 中国科学院研究生院数学系,清华大学光盘国家工程研究中心,中国科学院研究生院数学系北京,北京,北京
关键词
文本分类; k最近邻; 多维索引; 相似检索;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
k最近邻方法是一种简单而有效的文本分类方法,但是传统的k最近邻分类方法在训练集数据量很大情况下,全局的最优搜索几乎是不可能的.因此,加速k个最近邻的搜索是k最近邻方法实用的关键.提出了一种基于k最近邻的快速文本分类方法,它能够保证在海量数据集中进行快速有效的分类.实验结果表明,这一方法较传统方法性能有显著提升.
引用
收藏
页码:554 / 559
页数:6
相关论文
共 4 条
  • [1] 一种支持快速相似检索的多维索引结构
    冯玉才
    曹奎
    曹忠升
    [J]. 软件学报, 2002, (08) : 1678 - 1685
  • [2] 一种基于近邻搜索的快速k-近邻分类算法
    王壮
    胡卫东
    郁文贤
    庄钊文
    [J]. 系统工程与电子技术, 2002, (04) : 100 - 102
  • [3] The TV-tree: An index structure for high-dimensional data[J] . King-Ip Lin,H. V. Jagadish,Christos Faloutsos.The VLDB Journal . 1994 (4)
  • [4] Condensed nearest neighbor rule. Hart PE. IEEETransactions on Information Theory . 1968