一种基于k最近邻的快速文本分类方法

被引：13

作者：

张庆国

张宏伟

张君玉

机构：

[1] 中国科学院研究生院数学系,清华大学光盘国家工程研究中心,中国科学院研究生院数学系北京,北京,北京

来源：

中国科学院研究生院学报 | 2005年 / 05期

关键词：

文本分类; k最近邻; 多维索引; 相似检索;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

k最近邻方法是一种简单而有效的文本分类方法,但是传统的k最近邻分类方法在训练集数据量很大情况下,全局的最优搜索几乎是不可能的.因此,加速k个最近邻的搜索是k最近邻方法实用的关键.提出了一种基于k最近邻的快速文本分类方法,它能够保证在海量数据集中进行快速有效的分类.实验结果表明,这一方法较传统方法性能有显著提升.

引用

页码：554 / 559

页数：6

共 4 条

[1] 一种支持快速相似检索的多维索引结构
冯玉才
曹奎
曹忠升
[J]. 软件学报, 2002, (08) : 1678 - 1685
[2] 一种基于近邻搜索的快速k-近邻分类算法
王壮
胡卫东
郁文贤
庄钊文
[J]. 系统工程与电子技术, 2002, (04) : 100 - 102
[3] The TV-tree: An index structure for high-dimensional data[J] . King-Ip Lin,H. V. Jagadish,Christos Faloutsos.The VLDB Journal . 1994 (4)
[4] Condensed nearest neighbor rule. Hart PE. IEEETransactions on Information Theory . 1968

← 1 →