学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
文本分类中的特征提取方法的研究
被引:3
作者
:
姚学礼
论文数:
0
引用数:
0
h-index:
0
机构:
河南省政法管理干部学院
姚学礼
机构
:
[1]
河南省政法管理干部学院
来源
:
光盘技术
|
2009年
/ 06期
关键词
:
文本分类;
特征提取;
方法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
文本的特征提取是文本分类过程中的一个重要环节,它的好坏将直接影响文本分类的准确率。该文介绍了词条的统计方法(CHI)、词条与类别的互信息(MI)、信息增益(IG)、词条的期望交叉熵(CE)等文本特征提取方法,并对其取词策略进行了改进。
引用
收藏
页码:15 / 16
页数:2
相关论文
共 2 条
[1]
文本分类中的特征抽取
[J].
论文数:
引用数:
h-index:
机构:
秦进
;
论文数:
引用数:
h-index:
机构:
陈笑蓉
;
汪维家
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学计算机科学系,贵州大学计算机科学系,贵州大学计算机科学系,上海交通大学计算机科学与工程系贵州贵阳,贵州贵阳,贵州贵阳,上海
汪维家
;
陆汝占
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学计算机科学系,贵州大学计算机科学系,贵州大学计算机科学系,上海交通大学计算机科学与工程系贵州贵阳,贵州贵阳,贵州贵阳,上海
陆汝占
.
计算机应用,
2003,
(02)
:45
-46
[2]
独立于语种的文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
黄萱菁
;
论文数:
引用数:
h-index:
机构:
吴立德
;
石崎洋之
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
石崎洋之
;
徐国伟
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
徐国伟
.
中文信息学报,
2000,
(06)
:1
-7
←
1
→
共 2 条
[1]
文本分类中的特征抽取
[J].
论文数:
引用数:
h-index:
机构:
秦进
;
论文数:
引用数:
h-index:
机构:
陈笑蓉
;
汪维家
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学计算机科学系,贵州大学计算机科学系,贵州大学计算机科学系,上海交通大学计算机科学与工程系贵州贵阳,贵州贵阳,贵州贵阳,上海
汪维家
;
陆汝占
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学计算机科学系,贵州大学计算机科学系,贵州大学计算机科学系,上海交通大学计算机科学与工程系贵州贵阳,贵州贵阳,贵州贵阳,上海
陆汝占
.
计算机应用,
2003,
(02)
:45
-46
[2]
独立于语种的文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
黄萱菁
;
论文数:
引用数:
h-index:
机构:
吴立德
;
石崎洋之
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
石崎洋之
;
徐国伟
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
徐国伟
.
中文信息学报,
2000,
(06)
:1
-7
←
1
→