文本分类实现技术

被引:15
作者
王灏
黄厚宽
田盛丰
机构
[1] 北方交通大学计算机与信息技术学院
关键词
文本分类; 特征提取; 维数约简; 向量空间模型; 相似度; 组合模型;
D O I
10.16088/j.issn.1001-6600.2003.01.037
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
文本分类是文本数据挖掘的重要技术.从文本分类实现过程的各个环节,包括建立文档模型、特征提取、维数约简、选择分类策略几个方面分别给出了目前实用的解决方案,同时对各种算法进行了分类和性能上的定性与定量的比较,最后讨论了国内文本分类研究中的一些问题和未来的发展.
引用
收藏
页码:173 / 179
页数:7
相关论文
共 3 条
[1]   概念推理网及其在文本分类中的应用 [J].
李晓黎 ;
刘继敏 ;
史忠植 .
计算机研究与发展, 2000, (09) :1032-1038
[2]   Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520
[3]   可视化中文文本挖掘模型 [J].
林鸿飞 ;
贡大跃 ;
张跃 ;
姚天顺 .
计算机科学, 2000, (04) :37-41