微博短文本预处理及学习研究综述

被引:37
作者
王连喜
机构
[1] 广东外语外贸大学图书馆
关键词
微博短文本; 预处理; 短文本学习; 热点事件发现; 自动文摘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。
引用
收藏
页码:125 / 131
页数:7
相关论文
共 17 条
[1]   基于LDA的微博文本主题建模方法研究述评 [J].
张培晶 ;
宋蕾 .
图书情报工作, 2012, 56 (24) :120-126
[2]   基于潜在语义分析的微博主题挖掘模型研究 [J].
唐晓波 ;
王洪艳 .
图书情报工作, 2012, 56 (24) :114-119
[3]   微博用户关系挖掘研究综述 [J].
王连喜 ;
蒋盛益 ;
庞观松 ;
吴美玲 .
情报杂志, 2012, 31 (12) :91-97+57
[4]   微博及中文微博信息处理研究综述 [J].
文坤梅 ;
徐帅 ;
李瑞轩 ;
辜希武 ;
李玉华 .
中文信息学报, 2012, (06) :27-37
[5]   微博信息挖掘技术研究综述 [J].
蒋盛益 ;
麦智凯 ;
庞观松 ;
吴美玲 ;
王连喜 .
图书情报工作, 2012, (17) :136-142
[6]   基于特定领域的中文微博热点话题挖掘系统BTopicMiner [J].
李劲 ;
张华 ;
吴浩雄 ;
向军 .
计算机应用, 2012, 32 (08) :2346-2349
[7]   微博文本处理研究综述 [J].
张剑峰 ;
夏云庆 ;
姚建民 .
中文信息学报, 2012, 26 (04) :21-27+42
[8]   基于信息数据分析的微博研究综述 [J].
王晶 ;
朱珂 ;
汪斌强 .
计算机应用, 2012, 32 (07) :2027-2029+2037
[9]   基于隐主题分析和文本聚类的微博客中新闻话题的发现 [J].
路荣 ;
项亮 ;
刘明荣 ;
杨青 .
模式识别与人工智能, 2012, 25 (03) :382-387
[10]   文本自动分类技术研究综述 [J].
庞观松 ;
蒋盛益 .
情报理论与实践, 2012, (02) :123-128