学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
微博文本挖掘研究综述
被引:29
作者
:
论文数:
引用数:
h-index:
机构:
余容
论文数:
引用数:
h-index:
机构:
李光强
论文数:
引用数:
h-index:
机构:
尹健
机构
:
[1]
中南大学地球科学与信息物理学院
来源
:
情报探索
|
2017年
/ 05期
关键词
:
文本挖掘;
分类和聚类;
话题检测;
情感分析;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
[目的/意义]梳理国内外微博文本挖掘的研究现状,展望未来的研究方向。[方法/过程]介绍微博文本挖掘的背景和意义,从微博的数据获取、文本语义挖掘方法及应用研究3个方面,对比微博数据获取的不同方式,分析文本预处理过程和文本处理的若干方法,总结当前微博数据的应用现状。[结果/结论]微博数据获取技术主要有基于API、基于网络爬虫和基于网络数据流3种方式;微博文本挖掘涉及文本分类和聚类、话题检测、情感分析等方法;微博数据在舆情分析、商业营销及社会服务等方面已经得到广泛应用。
引用
收藏
页码:97 / 103
页数:7
相关论文
共 23 条
[1]
基于条件随机场的中文领域分词研究
[J].
论文数:
引用数:
h-index:
机构:
朱艳辉
;
论文数:
引用数:
h-index:
机构:
刘璟
;
论文数:
引用数:
h-index:
机构:
徐叶强
;
论文数:
引用数:
h-index:
机构:
田海龙
;
论文数:
引用数:
h-index:
机构:
马进
.
计算机工程与应用 ,
2016,
(15)
:97
-100
[2]
基于话题聚类及情感强度的中文微博舆情分析
[J].
论文数:
引用数:
h-index:
机构:
吴青林
;
论文数:
引用数:
h-index:
机构:
周天宏
.
情报理论与实践,
2016,
39
(01)
:109
-112
[3]
短文本相似度研究及其在微博话题检测中的应用
[J].
论文数:
引用数:
h-index:
机构:
黄贤英
;
论文数:
引用数:
h-index:
机构:
陈红阳
;
论文数:
引用数:
h-index:
机构:
刘英涛
.
计算机工程与设计,
2015,
36
(11)
:3128
-3133
[4]
基于SVM和CRF多特征组合的微博情感分析
[J].
李婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学计算机学院
李婷婷
;
论文数:
引用数:
h-index:
机构:
姬东鸿
.
计算机应用研究,
2015,
32
(04)
:978
-981
[5]
基于语义分析的中文微博情感分类方法
[J].
论文数:
引用数:
h-index:
机构:
杨佳能
;
论文数:
引用数:
h-index:
机构:
阳爱民
;
论文数:
引用数:
h-index:
机构:
周咏梅
.
山东大学学报(理学版),
2014,
49
(11)
:14
-21+30
[6]
微博数据获取技术及展望
[J].
游翔
论文数:
0
引用数:
0
h-index:
0
机构:
武警工程大学信息工程系
游翔
;
葛卫丽
论文数:
0
引用数:
0
h-index:
0
机构:
武警工程大学信息工程系
葛卫丽
.
电子科技,
2014,
(10)
:123
-126+132
[7]
2010年以来的突发事件微博舆论及其变化趋势——基于新浪微博的实证研究
[J].
论文数:
引用数:
h-index:
机构:
夏雨禾
.
新闻与传播研究,
2014,
21
(03)
:52
-67+127
[8]
公共危机事件中政务微博的舆情信息工作理念与策略探析——以雅安地震为例
[J].
肖飞
论文数:
0
引用数:
0
h-index:
0
机构:
南京政治学院军事新闻传播系
肖飞
.
图书情报工作,
2014,
58
(01)
:44
-47+71
[9]
基于词典和规则集的中文微博情感分析
[J].
论文数:
引用数:
h-index:
机构:
王志涛
;
论文数:
引用数:
h-index:
机构:
於志文
;
论文数:
引用数:
h-index:
机构:
郭斌
;
论文数:
引用数:
h-index:
机构:
路新江
.
计算机工程与应用 ,
2015,
(08)
:218
-225
[10]
微博网络信息传播研究综述
[J].
陈慧娟
论文数:
0
引用数:
0
h-index:
0
机构:
安徽工业大学计算机学院
陈慧娟
;
论文数:
引用数:
h-index:
机构:
郑啸
;
陈欣
论文数:
0
引用数:
0
h-index:
0
机构:
安徽工业大学计算机学院
陈欣
.
计算机应用研究,
2014,
31
(02)
:333
-338
←
1
2
3
→
共 23 条
[1]
基于条件随机场的中文领域分词研究
[J].
论文数:
引用数:
h-index:
机构:
朱艳辉
;
论文数:
引用数:
h-index:
机构:
刘璟
;
论文数:
引用数:
h-index:
机构:
徐叶强
;
论文数:
引用数:
h-index:
机构:
田海龙
;
论文数:
引用数:
h-index:
机构:
马进
.
计算机工程与应用 ,
2016,
(15)
:97
-100
[2]
基于话题聚类及情感强度的中文微博舆情分析
[J].
论文数:
引用数:
h-index:
机构:
吴青林
;
论文数:
引用数:
h-index:
机构:
周天宏
.
情报理论与实践,
2016,
39
(01)
:109
-112
[3]
短文本相似度研究及其在微博话题检测中的应用
[J].
论文数:
引用数:
h-index:
机构:
黄贤英
;
论文数:
引用数:
h-index:
机构:
陈红阳
;
论文数:
引用数:
h-index:
机构:
刘英涛
.
计算机工程与设计,
2015,
36
(11)
:3128
-3133
[4]
基于SVM和CRF多特征组合的微博情感分析
[J].
李婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学计算机学院
李婷婷
;
论文数:
引用数:
h-index:
机构:
姬东鸿
.
计算机应用研究,
2015,
32
(04)
:978
-981
[5]
基于语义分析的中文微博情感分类方法
[J].
论文数:
引用数:
h-index:
机构:
杨佳能
;
论文数:
引用数:
h-index:
机构:
阳爱民
;
论文数:
引用数:
h-index:
机构:
周咏梅
.
山东大学学报(理学版),
2014,
49
(11)
:14
-21+30
[6]
微博数据获取技术及展望
[J].
游翔
论文数:
0
引用数:
0
h-index:
0
机构:
武警工程大学信息工程系
游翔
;
葛卫丽
论文数:
0
引用数:
0
h-index:
0
机构:
武警工程大学信息工程系
葛卫丽
.
电子科技,
2014,
(10)
:123
-126+132
[7]
2010年以来的突发事件微博舆论及其变化趋势——基于新浪微博的实证研究
[J].
论文数:
引用数:
h-index:
机构:
夏雨禾
.
新闻与传播研究,
2014,
21
(03)
:52
-67+127
[8]
公共危机事件中政务微博的舆情信息工作理念与策略探析——以雅安地震为例
[J].
肖飞
论文数:
0
引用数:
0
h-index:
0
机构:
南京政治学院军事新闻传播系
肖飞
.
图书情报工作,
2014,
58
(01)
:44
-47+71
[9]
基于词典和规则集的中文微博情感分析
[J].
论文数:
引用数:
h-index:
机构:
王志涛
;
论文数:
引用数:
h-index:
机构:
於志文
;
论文数:
引用数:
h-index:
机构:
郭斌
;
论文数:
引用数:
h-index:
机构:
路新江
.
计算机工程与应用 ,
2015,
(08)
:218
-225
[10]
微博网络信息传播研究综述
[J].
陈慧娟
论文数:
0
引用数:
0
h-index:
0
机构:
安徽工业大学计算机学院
陈慧娟
;
论文数:
引用数:
h-index:
机构:
郑啸
;
陈欣
论文数:
0
引用数:
0
h-index:
0
机构:
安徽工业大学计算机学院
陈欣
.
计算机应用研究,
2014,
31
(02)
:333
-338
←
1
2
3
→