引入特征倾向性的高效网络文本数据挖掘

被引:5
作者
胡海斌
机构
[1] 西华师范大学实验中心
关键词
网络文本; 倾向性特征; 数据挖掘; 布尔加权;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
网络文本挖掘方法是网络信息技术的核心。利用传统方法进行网络文本挖掘的过程中,仅仅以模式识别的思维对文本特征进行分类挖掘,以设定模糊规则的方式克服相似性干扰,但是,模糊规则设定过程需要加入大量约束条件,导致挖掘准确率降低。提出一种引入特征倾向性的网络文本挖掘方法。不再设定约束条件,而是将词汇的倾向性度量值设置合适的阀值,作为词汇权重的一部分,利用布尔加权法对词汇进行加权处理,对词汇的倾向性权重进行自适应修改,完成网络文本倾向性特征提取,利用核心词汇的语义将网络文本进行分类,实现网络文本的高效挖掘。实验结果表明,利用倾向性特征方法进行网络文本挖掘,能够提高挖掘的精度,收敛性更强,效果令人满意。
引用
收藏
页码:436 / 440
页数:5
相关论文
共 10 条
[1]
结合语义和文本特征位串的高效KNN算法 [J].
林啟锋 ;
蒙祖强 ;
陈秋莲 ;
陈智敏 .
计算机工程与设计, 2013, 34 (07) :2417-2421+2469
[2]
[3]
网络文本挖掘相关技术的发展现状和问题 [J].
王才伟 ;
王锁花 .
江苏教育学院学报(自然科学), 2013, 29 (03) :29-33
[4]
基于鲁棒特征挖掘的图像副本检索 [J].
张伟 ;
高科 ;
李锦涛 ;
曹岗 .
计算机辅助设计与图形学学报, 2013, 25 (06) :843-851
[5]
基于信息增益的文本特征选择方法 [J].
胡颖 .
计算机与数字工程, 2013, 41 (03) :460-462
[6]
高光谱遥感数据特征挖掘技术研究进展 [J].
何明一 ;
畅文娟 ;
梅少辉 .
航天返回与遥感, 2013, 34 (01) :1-12
[7]
基于KDD的文本特征抽取模型 [J].
史雯 .
山西电子技术, 2013, (01) :65-67
[9]
锐化高斯模板在文本特征项权重调整方法中的应用 [J].
路永和 ;
何新宇 .
现代图书情报技术, 2012, (12) :39-44
[10]
基于百度百科与文本分类的网络文本语义主题抽取方法 [J].
陈叶旺 ;
王华珍 ;
李海波 ;
钟必能 ;
陈锻生 .
小型微型计算机系统, 2012, 33 (12) :2605-2610