微博文本挖掘研究综述

被引:29
作者
余容
李光强
尹健
机构
[1] 中南大学地球科学与信息物理学院
关键词
文本挖掘; 分类和聚类; 话题检测; 情感分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
[目的/意义]梳理国内外微博文本挖掘的研究现状,展望未来的研究方向。[方法/过程]介绍微博文本挖掘的背景和意义,从微博的数据获取、文本语义挖掘方法及应用研究3个方面,对比微博数据获取的不同方式,分析文本预处理过程和文本处理的若干方法,总结当前微博数据的应用现状。[结果/结论]微博数据获取技术主要有基于API、基于网络爬虫和基于网络数据流3种方式;微博文本挖掘涉及文本分类和聚类、话题检测、情感分析等方法;微博数据在舆情分析、商业营销及社会服务等方面已经得到广泛应用。
引用
收藏
页码:97 / 103
页数:7
相关论文
共 23 条
[1]
基于条件随机场的中文领域分词研究 [J].
朱艳辉 ;
刘璟 ;
徐叶强 ;
田海龙 ;
马进 .
计算机工程与应用 , 2016, (15) :97-100
[2]
基于话题聚类及情感强度的中文微博舆情分析 [J].
吴青林 ;
周天宏 .
情报理论与实践, 2016, 39 (01) :109-112
[3]
短文本相似度研究及其在微博话题检测中的应用 [J].
黄贤英 ;
陈红阳 ;
刘英涛 .
计算机工程与设计, 2015, 36 (11) :3128-3133
[4]
基于SVM和CRF多特征组合的微博情感分析 [J].
李婷婷 ;
姬东鸿 .
计算机应用研究, 2015, 32 (04) :978-981
[5]
基于语义分析的中文微博情感分类方法 [J].
杨佳能 ;
阳爱民 ;
周咏梅 .
山东大学学报(理学版), 2014, 49 (11) :14-21+30
[6]
微博数据获取技术及展望 [J].
游翔 ;
葛卫丽 .
电子科技, 2014, (10) :123-126+132
[8]
公共危机事件中政务微博的舆情信息工作理念与策略探析——以雅安地震为例 [J].
肖飞 .
图书情报工作, 2014, 58 (01) :44-47+71
[9]
基于词典和规则集的中文微博情感分析 [J].
王志涛 ;
於志文 ;
郭斌 ;
路新江 .
计算机工程与应用 , 2015, (08) :218-225
[10]
微博网络信息传播研究综述 [J].
陈慧娟 ;
郑啸 ;
陈欣 .
计算机应用研究, 2014, 31 (02) :333-338