基于K-近邻方法的网络信息文本分类

被引:2
作者
刘开袆 [1 ]
江志雄 [2 ]
机构
[1] 贵州大方发电有限公司
[2] 上海海港通信技术有限公司
关键词
文本分类; 最近邻; K-近邻; 特征提取;
D O I
10.15958/j.cnki.gdxbzrb.2009.03.032
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出了一种网络信息文本分类模型的建立方法。根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型。分别进行了基于最近邻决策和K-邻近决策的分类效果试验研究,结果显示:K-近邻决策的分类效果要优于最近邻决策的分类效果。
引用
收藏
页码:60 / 63
页数:4
相关论文
共 6 条
  • [1] 独立于语种的文本分类方法
    黄萱菁
    吴立德
    石崎洋之
    徐国伟
    [J]. 中文信息学报, 2000, (06) : 1 - 7
  • [2] 中文文献的层次分类方法
    战学刚
    林鸿飞
    姚天顺
    [J]. 中文信息学报, 1999, (06) : 20 - 25
  • [3] 中文文本的关键词自动抽取和模糊分类
    何新贵
    彭甫阳
    [J]. 中文信息学报, 1999, (01) : 10 - 16
  • [4] 基于向量空间模型的文档分类系统
    黄萱菁
    吴立德
    [J]. 模式识别与人工智能, 1998, 11 (02) : 147 - 153
  • [5] 自然语言理解[M]. 清华大学出版社 , 姚天顺等编著, 2002
  • [6] A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)