共 17 条
微博短文本预处理及学习研究综述
被引:37
作者:

王连喜
论文数: 0 引用数: 0
h-index: 0
机构: 广东外语外贸大学图书馆
机构:
[1] 广东外语外贸大学图书馆
来源:
关键词:
微博短文本;
预处理;
短文本学习;
热点事件发现;
自动文摘;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。
引用
收藏
页码:125 / 131
页数:7
相关论文
共 17 条
[1]
基于LDA的微博文本主题建模方法研究述评
[J].
张培晶
;
宋蕾
.
图书情报工作,
2012, 56 (24)
:120-126

张培晶
论文数: 0 引用数: 0
h-index: 0
机构:
中国人民公安大学办公室 中国人民公安大学办公室

宋蕾
论文数: 0 引用数: 0
h-index: 0
机构:
北京警察学院公安科技系 中国人民公安大学办公室
[2]
基于潜在语义分析的微博主题挖掘模型研究
[J].
唐晓波
;
王洪艳
.
图书情报工作,
2012, 56 (24)
:114-119

唐晓波
论文数: 0 引用数: 0
h-index: 0
机构: 武汉大学信息资源研究中心

论文数: 引用数:
h-index:
机构:
[3]
微博用户关系挖掘研究综述
[J].
王连喜
;
蒋盛益
;
庞观松
;
吴美玲
.
情报杂志,
2012, 31 (12)
:91-97+57

王连喜
论文数: 0 引用数: 0
h-index: 0
机构:
广东外语外贸大学图书馆 广东外语外贸大学图书馆

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[4]
微博及中文微博信息处理研究综述
[J].
文坤梅
;
徐帅
;
李瑞轩
;
辜希武
;
李玉华
.
中文信息学报,
2012, (06)
:27-37

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[5]
微博信息挖掘技术研究综述
[J].
蒋盛益
;
麦智凯
;
庞观松
;
吴美玲
;
王连喜
.
图书情报工作,
2012, (17)
:136-142

论文数: 引用数:
h-index:
机构:

麦智凯
论文数: 0 引用数: 0
h-index: 0
机构:
广东外语外贸大学信息学院 广东外语外贸大学信息学院

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

王连喜
论文数: 0 引用数: 0
h-index: 0
机构:
广东外语外贸大学图书馆 广东外语外贸大学信息学院
[6]
基于特定领域的中文微博热点话题挖掘系统BTopicMiner
[J].
李劲
;
张华
;
吴浩雄
;
向军
.
计算机应用,
2012, 32 (08)
:2346-2349

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

吴浩雄
论文数: 0 引用数: 0
h-index: 0
机构:
湖北民族学院信息工程学院 湖北民族学院信息工程学院

论文数: 引用数:
h-index:
机构:
[7]
微博文本处理研究综述
[J].
张剑峰
;
夏云庆
;
姚建民
.
中文信息学报,
2012, 26 (04)
:21-27+42

张剑峰
论文数: 0 引用数: 0
h-index: 0
机构:
清华大学
苏州大学 清华大学

夏云庆
论文数: 0 引用数: 0
h-index: 0
机构:
清华大学 清华大学

姚建民
论文数: 0 引用数: 0
h-index: 0
机构:
苏州大学 清华大学
[8]
基于信息数据分析的微博研究综述
[J].
王晶
;
朱珂
;
汪斌强
.
计算机应用,
2012, 32 (07)
:2027-2029+2037

王晶
论文数: 0 引用数: 0
h-index: 0
机构: 国家数字交换系统工程技术研究中心

朱珂
论文数: 0 引用数: 0
h-index: 0
机构: 国家数字交换系统工程技术研究中心

汪斌强
论文数: 0 引用数: 0
h-index: 0
机构: 国家数字交换系统工程技术研究中心
[9]
基于隐主题分析和文本聚类的微博客中新闻话题的发现
[J].
路荣
;
项亮
;
刘明荣
;
杨青
.
模式识别与人工智能,
2012, 25 (03)
:382-387

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
[10]
文本自动分类技术研究综述
[J].
庞观松
;
蒋盛益
.
情报理论与实践,
2012, (02)
:123-128

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构: