文本分类的字典生成

被引:3
作者
王树梅
戴保存
吴慧中
王飞
机构
[1] 南京理工大学计算机科学与技术系
[2] 南京理工大学计算机科学与技术系 南京
[3] 南京
关键词
文本分类; 字典生成; 义类; 向量压缩;
D O I
10.14177/j.cnki.32-1397n.2002.05.017
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了提高系统处理开放语料的能力和解决一个概念可由多个不同的单词表达的问题 ,该文引入义类的概念 ,设计出一个具有模拟推理功能 ,同时具有对向量维数进行语义压缩的字典生成算法 ,构造了一个图结构的字典。利用该字典 ,可以提高文本分类系统的性能 ,改善系统的模拟推理能力以及系统的效率。
引用
收藏
页码:517 / 521
页数:5
相关论文
共 3 条
[1]   基于特征相关性的汉语文本自动分类模型的研究 [J].
张月杰 ;
姚天顺 .
小型微型计算机系统, 1998, (08) :50-56
[2]   中文文本中抽取特征信息的区域与技术 [J].
刘开瑛 ;
薛翠芳 ;
郑家恒 ;
周晓强 ;
不详 .
中文信息学报 , 1998, (02) :2-8
[3]   档案自动分类算法研究 [J].
苏新宁,徐进鸿,史九林 .
情报学报, 1995, (03) :194-200