学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
Bayes文本分类器的改进方法研究
被引:11
作者
:
论文数:
引用数:
h-index:
机构:
鲁明羽
机构
:
[1]
大连海事大学计算机科学与技术学院
来源
:
计算机工程
|
2006年
/ 17期
关键词
:
文本分类;
朴素Bayes分类模型;
权值调整;
EM算法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
在文本分类领域,Bayes分类器是一种常用且效果较好的、基于概率的分类器,具有较严密的理论基础。该文对朴素Bayes文本分类器进行了分析,提出了利用权值调整机制改善其分类性能的方法,以及在缺乏大量训练文本的情况下,利用EM算法进行非监督Bayes分类的方法,并讨论了如何运用启发式方法确定Bayes网络结构,在更贴近真实环境的情况下进行文本分类。
引用
收藏
页码:63 / 65
页数:3
相关论文
共 5 条
[1]
一种限定性的双层贝叶斯分类模型
[J].
石洪波
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
石洪波
;
王志海
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
王志海
;
黄厚宽
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
黄厚宽
;
励晓健
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
励晓健
.
软件学报,
2004,
(02)
:193
-199
[2]
基于权值调整的文本分类改进方法
[J].
鲁明羽
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
鲁明羽
;
李凡
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
李凡
;
庞淑英
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
庞淑英
;
陆玉昌
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
陆玉昌
;
周立柱
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
周立柱
.
清华大学学报(自然科学版),
2003,
(04)
:513
-515+520
[3]
关于文本特征抽取新方法的研究
[J].
李凡
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室!北京
李凡
;
鲁明羽
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室!北京
鲁明羽
;
陆玉昌
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室!北京
陆玉昌
.
清华大学学报(自然科学版),
2001,
(07)
:98
-101
[4]
高等数理统计[M]. 高等教育出版社 , 茆诗松, 2006
[5]
Bayesian Network Classifiers
[J].
论文数:
引用数:
h-index:
机构:
Nir Friedman
;
Dan Geiger
论文数:
0
引用数:
0
h-index:
0
机构:
University of California,Computer Science Division
Dan Geiger
;
Moises Goldszmidt
论文数:
0
引用数:
0
h-index:
0
机构:
University of California,Computer Science Division
Moises Goldszmidt
.
Machine Learning,
1997,
29
:131
-163
←
1
→
共 5 条
[1]
一种限定性的双层贝叶斯分类模型
[J].
石洪波
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
石洪波
;
王志海
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
王志海
;
黄厚宽
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
黄厚宽
;
励晓健
论文数:
0
引用数:
0
h-index:
0
机构:
北京交通大学计算机与信息技术学院
励晓健
.
软件学报,
2004,
(02)
:193
-199
[2]
基于权值调整的文本分类改进方法
[J].
鲁明羽
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
鲁明羽
;
李凡
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
李凡
;
庞淑英
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
庞淑英
;
陆玉昌
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
陆玉昌
;
周立柱
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
周立柱
.
清华大学学报(自然科学版),
2003,
(04)
:513
-515+520
[3]
关于文本特征抽取新方法的研究
[J].
李凡
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室!北京
李凡
;
鲁明羽
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室!北京
鲁明羽
;
陆玉昌
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室!北京
陆玉昌
.
清华大学学报(自然科学版),
2001,
(07)
:98
-101
[4]
高等数理统计[M]. 高等教育出版社 , 茆诗松, 2006
[5]
Bayesian Network Classifiers
[J].
论文数:
引用数:
h-index:
机构:
Nir Friedman
;
Dan Geiger
论文数:
0
引用数:
0
h-index:
0
机构:
University of California,Computer Science Division
Dan Geiger
;
Moises Goldszmidt
论文数:
0
引用数:
0
h-index:
0
机构:
University of California,Computer Science Division
Moises Goldszmidt
.
Machine Learning,
1997,
29
:131
-163
←
1
→