基于朴素贝叶斯分类器的朝鲜语文本分类的研究

被引:17
作者
周国强
崔荣一
机构
[1] 延边大学计算机科学与技术学科智能信息处理研究室
关键词
朝鲜语; 朴素贝叶斯; 文本分类; TF-IDF;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文基于朴素贝叶斯分类器对朝鲜语文本分类进行了研究。首先,利用基于类别选择的特征选择方法对朝鲜语文本进行特征选择,并使用类TF-IDF估算方法计算权重;其次,构造朴素贝叶斯分类器;最后,利用分类器实现对朝鲜语文本的分类。实验表明,该方法在朝鲜语文本分类中具有较好的效果,为朝汉结合文本分类提供了一定的依据。
引用
收藏
页码:16 / 19
页数:4
相关论文
共 8 条
[1]
属性加权的朴素贝叶斯集成分类器 [J].
张雯 ;
张化祥 .
计算机工程与应用 , 2010, (29) :144-146
[2]
基于机器学习的文本分类技术的研究 [J].
何国辉 ;
吴礼发 .
计算机与现代化, 2009, (08) :4-6
[3]
一种改进的朴素贝叶斯分类器在文本分类中的应用研究 [J].
张璇 ;
左敏 .
北京工商大学学报(自然科学版), 2009, 27 (04) :52-55
[4]
国内文本分类研究论文的统计分析 [J].
王志玲 ;
王效岳 .
图书情报工作 , 2006, (11) :136-138
[5]
基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[6]
面向语言信息处理的朝鲜语知识库研究[J] 毕玉德 中文信息学报 2005, 03
[7]
基于机器学习的文本分类研究[D] 吴科 上海交通大学 2008,
[8]
中文文本分类的研究与应用 [D]. 
梅君 .
南昌大学,
2010