基于概念的文本类别特征提取与文本模糊匹配

被引:19
作者
罗三定
陆文彦
王浩
贾维嘉
不详
机构
[1] 中南大学信息科学与工程学院
[2] 香港城市大学电脑工程与信息技术系 长沙
[3] 长沙
[4] 香港
关键词
概念网络; 概念空间; 特征提取; 文本分类; 模糊距离;
D O I
暂无
中图分类号
TP399 [在其他方面的应用];
学科分类号
摘要
文本信息特征提取和文本分类是当前智能信息服务系统基础研究的重点。该文给出一种新的类别特征提取与文本匹配方法。首先对术语特征权进行了综合计算,然后基于概念网络术语—概念映射关系,将特征权由术语空间转换到概念空间并做权值限幅处理。在此基础上,通过对概念进行类内和类间的统计分析,得到类别特征的均值与方差两个向量,通过模糊距离计算来对文本进行类别匹配。该文方法克服了传统IDF方法缺点,能有效地从概念上提取文本类特征,提高文本自动分类的准确性。
引用
收藏
页码:97 / 99+104 +104
页数:4
相关论文
共 2 条
[1]   中文文本的关键词自动抽取和模糊分类 [J].
何新贵 ;
彭甫阳 .
中文信息学报, 1999, (01) :10-16
[2]   语义矢量空间模式(SVSM)及其试验评价——自然语言处理与文献自动标引 [J].
Geofrey Z.Liu .
情报学报, 1996, (06) :2-13