文本分类中的特征抽取

被引:70
作者
秦进
陈笑蓉
汪维家
陆汝占
机构
[1] 贵州大学计算机科学系
[2] 上海交通大学计算机科学与工程系
关键词
文本分类; 特征抽取; 互信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
特征抽取是用机器学习方法进行文本分类的重点和难点。文中比较了目前几种最常用的特征抽取方法,提出了一种改进型的互信息特征抽取方法。并在构建的实验系统中比较了这几种特征抽取方法,发现改进的特征抽取方法是有效可行的。
引用
收藏
页码:45 / 46
页数:2
相关论文
共 3 条
  • [1] 独立于语种的文本分类方法
    黄萱菁
    吴立德
    石崎洋之
    徐国伟
    [J]. 中文信息学报, 2000, (06) : 1 - 7
  • [2] 文本自动分类中的词权重与分类算法
    刁倩
    王永成
    张惠惠
    何骥
    [J]. 中文信息学报, 2000, (03) : 25 - 29
  • [3] 知识发现.[M].史忠植著;.清华大学出版社.2002,