一种可靠信任推荐文本分类特征权重算法

被引:5
作者
焦庆争 [1 ,2 ]
蔚承建 [1 ]
机构
[1] 南京工业大学信息科学与工程学院
[2] 安徽师范大学信息管理中心
关键词
文本分类; 特征权重; 可信计算; 概率确定性密度; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。
引用
收藏
页码:472 / 474
页数:3
相关论文
共 3 条
[1]   面向文本分类的混淆类判别技术 [J].
朱靖波 ;
王会珍 ;
张希娟 .
软件学报, 2008, (03) :630-639
[2]   基于内容和合作模式的信息推荐机制 [J].
林鸿飞 ;
杨志豪 ;
赵晶 .
中文信息学报, 2005, (01) :48-55
[3]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90