基于聚类分析的国内文本挖掘热点与趋势研究

被引:37
作者
谭章禄
彭胜男
王兆刚
机构
[1] 中国矿业大学(北京)管理学院
关键词
文本挖掘; 聚类分析; 研究热点; 趋势;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
了解国内文本挖掘领域的研究热点和趋势,对于掌握领域内容的发展变化及促进相关研究的进一步发展具有重要意义。首先,本文以CNKI数据库中1998—2017年的1155篇文本挖掘相关主题的研究文献为样本,以文章关键词的词频矩阵为数据,利用SPSS软件对其进行聚类分析。然后采用卡方统计抽取高关联度关键词对聚类结果进行解读,根据聚类结果将文本挖掘领域的文献从宏观上划分为13类,从而把握国内文本挖掘的研究热点与趋势。分析结果表明,国内关于文本挖掘的基础研究、文本大数据预处理、文本挖掘应用领域的研究是热点,有关关联规则、文本聚类、文本分类相关的应用研究文献数量较少,未来关于文本主题分析、文本大数据预处理、网络文本挖掘的研究可能成为新的趋势。
引用
收藏
页码:578 / 585
页数:8
相关论文
共 27 条
[1]   文本数据主题挖掘与关联搜索研究 [J].
朱卫星 ;
徐伟光 ;
何红悦 ;
李雯 .
计算机科学, 2017, 44(S2) (S2) :411-413+456
[2]   国际文本挖掘研究主题群识别与演化趋势分析 [J].
张敏 ;
罗梅芬 ;
张艳 .
图书馆学研究 , 2017, (02) :15-21
[3]   文本挖掘在中文信息分析中的应用研究述评 [J].
李尚昊 ;
朝乐门 .
情报科学, 2016, 34 (08) :153-159
[4]   生物医学文本挖掘研究热点分析 [J].
史航 ;
高雯珺 ;
崔雷 .
中华医学图书情报杂志, 2016, 25 (02) :27-33
[5]   基于文本挖掘的学习分析应用研究 [J].
刘三女牙 ;
彭晛 ;
刘智 ;
孙建文 ;
刘林 ;
郑年亨 .
电化教育研究, 2016, 37 (02) :23-30
[6]   文本挖掘用于社会科学研究:现状、问题与展望 [J].
徐德金 ;
张伦 .
科学与社会, 2015, 5 (03) :75-89
[7]   一种基于词频信息的改进CHI文本特征选择 [J].
刘海峰 ;
苏展 ;
刘守生 .
计算机工程与应用 , 2013, (22) :110-114
[8]   数字人文中的文本挖掘研究 [J].
郭金龙 ;
许鑫 .
大学图书馆学报, 2012, 30 (03) :11-18
[9]   社会科学信息分析中的文本挖掘 [J].
范并思 .
图书情报工作 , 2012, (08) :6-9
[10]   文本挖掘工具述评 [J].
张雯雯 ;
许鑫 .
图书情报工作 , 2012, (08) :26-31+55