学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于模糊向量和BP网络的Web文本自动分类方法
被引:2
作者
:
李小红
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
李小红
许少华
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
许少华
机构
:
[1]
大庆石油学院计算机科学与工程学院
来源
:
福建电脑
|
2006年
/ 02期
关键词
:
数据挖掘;
模糊向量空间模型;
文本分类;
BP网络;
模糊特征向量;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
针对Web信息挖掘中的文本自动分类问题,提出了一种基于模糊向量空间模型和BP网络的分类方法。在进行文本分类特征提取时,根据特征词在文档中的位置信息和文档结构,构造出模糊分类特征向量,在此基础上,采用BP网络对Web文档进行分类,使分类方法更接近于手工分类,提高了文本分类的精度。文中以中国期刊网专题分类为例验证了方法的有效性。
引用
收藏
页码:94 / 95
页数:2
相关论文
共 7 条
[1]
基于文本集密度的特征词选择与权重计算方法
吴卫华
论文数:
0
引用数:
0
h-index:
0
机构:
山东省智奥电算开发中心
吴卫华
论文数:
引用数:
h-index:
机构:
袁宁
论文数:
引用数:
h-index:
机构:
周劲
王洪军
论文数:
0
引用数:
0
h-index:
0
机构:
山东省智奥电算开发中心
王洪军
[J].
计算机与数字工程,
2005,
(03)
: 11
-
13+52
[2]
基于VSM的中文文本分类系统的设计与实现
张东礼
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
张东礼
汪东升
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
汪东升
郑纬民
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
郑纬民
[J].
清华大学学报(自然科学版),
2003,
(09)
: 1288
-
1291
[3]
文本分割算法对中文信息过滤影响研究
朱寰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所软件工程技术中心
朱寰
阮彤
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所软件工程技术中心
阮彤
于庆喜
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所软件工程技术中心
于庆喜
[J].
计算机工程与应用,
2002,
(13)
: 62
-
65
[4]
一种改进的kNN方法及其在文本分类中的应用
孙丽华
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机科学与技术学院
孙丽华
张积东
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机科学与技术学院
张积东
李静梅
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机科学与技术学院
李静梅
[J].
应用科技,
2002,
(02)
: 25
-
27
[5]
中文文本的关键词自动抽取和模糊分类
何新贵
论文数:
0
引用数:
0
h-index:
0
机构:
北京系统工程研究所
何新贵
彭甫阳
论文数:
0
引用数:
0
h-index:
0
机构:
北京系统工程研究所
彭甫阳
[J].
中文信息学报,
1999,
(01)
: 10
-
16
[6]
模糊多准则决策理论与应用.[M].李荣钧著;.科学出版社.2002,
[7]
模糊知识处理的理论与技术.[M].何新贵著;.国防工业出版社.1998,
←
1
→
共 7 条
[1]
基于文本集密度的特征词选择与权重计算方法
吴卫华
论文数:
0
引用数:
0
h-index:
0
机构:
山东省智奥电算开发中心
吴卫华
论文数:
引用数:
h-index:
机构:
袁宁
论文数:
引用数:
h-index:
机构:
周劲
王洪军
论文数:
0
引用数:
0
h-index:
0
机构:
山东省智奥电算开发中心
王洪军
[J].
计算机与数字工程,
2005,
(03)
: 11
-
13+52
[2]
基于VSM的中文文本分类系统的设计与实现
张东礼
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
张东礼
汪东升
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
汪东升
郑纬民
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
郑纬民
[J].
清华大学学报(自然科学版),
2003,
(09)
: 1288
-
1291
[3]
文本分割算法对中文信息过滤影响研究
朱寰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所软件工程技术中心
朱寰
阮彤
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所软件工程技术中心
阮彤
于庆喜
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所软件工程技术中心
于庆喜
[J].
计算机工程与应用,
2002,
(13)
: 62
-
65
[4]
一种改进的kNN方法及其在文本分类中的应用
孙丽华
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机科学与技术学院
孙丽华
张积东
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机科学与技术学院
张积东
李静梅
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工程大学计算机科学与技术学院
李静梅
[J].
应用科技,
2002,
(02)
: 25
-
27
[5]
中文文本的关键词自动抽取和模糊分类
何新贵
论文数:
0
引用数:
0
h-index:
0
机构:
北京系统工程研究所
何新贵
彭甫阳
论文数:
0
引用数:
0
h-index:
0
机构:
北京系统工程研究所
彭甫阳
[J].
中文信息学报,
1999,
(01)
: 10
-
16
[6]
模糊多准则决策理论与应用.[M].李荣钧著;.科学出版社.2002,
[7]
模糊知识处理的理论与技术.[M].何新贵著;.国防工业出版社.1998,
←
1
→