使用最大熵模型进行文本分类

被引:33
作者
陈雪天
李荣陆
不详
机构
[1] 国防科技大学电子科学与工程学院
[2] 复旦大学计算机与信息技术系 长沙
[3] 上海
关键词
文本分类; 最大熵模型; 特征; N-Gram;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
最大熵模型是一种在广泛应用于自然语言处理中的概率估计方法。文中使用最大熵模型进行了文本分类的研究。通过实验,将其和Bayes、KNN、SVM三种典型的文本分类器进行了比较,并且考虑了不同特征数目和平滑技术对基于最大熵模型的文本分类器的影响。结果显示它的分类性能胜于Bayes方法,与KNN和SVM方法相当,表明这是一种非常有前途的文本分类方法。
引用
收藏
页码:78 / 79+195 +195
页数:3
相关论文
empty
未找到相关数据