学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
文本分类中特征预抽取方法研究
被引:5
作者
:
郑伟
论文数:
0
引用数:
0
h-index:
0
机构:
河北北方学院理学院
河北北方学院理学院
郑伟
[
1
]
论文数:
引用数:
h-index:
机构:
吕建新
[
2
]
张建伟
论文数:
0
引用数:
0
h-index:
0
机构:
河北地质职工大学
河北北方学院理学院
张建伟
[
3
]
机构
:
[1]
河北北方学院理学院
[2]
河北北方学院图书馆
[3]
河北地质职工大学
来源
:
情报科学
|
2011年
/ 01期
关键词
:
文本分类;
特征;
抽取方法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
在文本分类中,特征抽取是一项很重要的工作,抽取到的特征项质量的好坏直接影响到分类的效果。在研究了文本分类中常用的文本特征词预抽取方法的基础上,提出了一种基于词性选择的特征预抽取方法,结合IG方法进行特征抽取。在分类实验中实验结果显示,这种基于词性的特征预抽取方法在分类过程中可以在不降低分类精度的同时可以减少特征维数和训练时间。
引用
收藏
页码:86 / 88+92 +92
页数:4
相关论文
共 7 条
[1]
基于本体的文本分类方法
[J].
张颖
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院研究生院
张颖
;
王文杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院研究生院
王文杰
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院研究生院
史忠植
.
计算机仿真,
2009,
26
(05)
:103
-106+178
[2]
自动文本分类方法研究述评
[J].
蒲筱哥
论文数:
0
引用数:
0
h-index:
0
机构:
徐州师范大学图书馆
蒲筱哥
.
情报科学 ,
2008,
(03)
:469
-475
[3]
文本分类中特征提取方法的比较与研究
[J].
郑伟
论文数:
0
引用数:
0
h-index:
0
机构:
河北北方学院理学院物理系
河北北方学院理学院物理系
郑伟
;
论文数:
引用数:
h-index:
机构:
王锐
.
河北北方学院学报(自然科学版),
2007,
(06)
:51
-54+64
[4]
文本分类中一种改进的特征选择方法
[J].
刘海峰
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军理工大学指挥自动化学院
刘海峰
;
王元元
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军理工大学指挥自动化学院
王元元
;
张学仁
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学理学院
解放军理工大学指挥自动化学院
张学仁
.
情报科学,
2007,
(10)
:1534
-1537
[5]
基于本体论的文本特征提取
[J].
论文数:
引用数:
h-index:
机构:
唐晓文
.
电脑与信息技术,
2005,
(01)
:36
-38+62
[6]
中文文本分类的特征选取评价
[J].
孙国菊
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁信息职业技术学院
孙国菊
;
张杰
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁信息职业技术学院
张杰
.
哈尔滨理工大学学报,
2005,
(01)
:76
-78
[7]
信息检索理论与技术[M]. 科学技术文献出版社 , 苏新宁主编, 2004
←
1
→
共 7 条
[1]
基于本体的文本分类方法
[J].
张颖
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院研究生院
张颖
;
王文杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院研究生院
王文杰
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院研究生院
史忠植
.
计算机仿真,
2009,
26
(05)
:103
-106+178
[2]
自动文本分类方法研究述评
[J].
蒲筱哥
论文数:
0
引用数:
0
h-index:
0
机构:
徐州师范大学图书馆
蒲筱哥
.
情报科学 ,
2008,
(03)
:469
-475
[3]
文本分类中特征提取方法的比较与研究
[J].
郑伟
论文数:
0
引用数:
0
h-index:
0
机构:
河北北方学院理学院物理系
河北北方学院理学院物理系
郑伟
;
论文数:
引用数:
h-index:
机构:
王锐
.
河北北方学院学报(自然科学版),
2007,
(06)
:51
-54+64
[4]
文本分类中一种改进的特征选择方法
[J].
刘海峰
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军理工大学指挥自动化学院
刘海峰
;
王元元
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院
解放军理工大学指挥自动化学院
王元元
;
张学仁
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学理学院
解放军理工大学指挥自动化学院
张学仁
.
情报科学,
2007,
(10)
:1534
-1537
[5]
基于本体论的文本特征提取
[J].
论文数:
引用数:
h-index:
机构:
唐晓文
.
电脑与信息技术,
2005,
(01)
:36
-38+62
[6]
中文文本分类的特征选取评价
[J].
孙国菊
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁信息职业技术学院
孙国菊
;
张杰
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁信息职业技术学院
张杰
.
哈尔滨理工大学学报,
2005,
(01)
:76
-78
[7]
信息检索理论与技术[M]. 科学技术文献出版社 , 苏新宁主编, 2004
←
1
→