微博文本处理研究综述

被引:50
作者
张剑峰 [1 ,2 ]
夏云庆 [1 ]
姚建民 [2 ]
机构
[1] 清华大学
[2] 苏州大学
关键词
微博文本; 语言分析; 文本处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
微博是一个基于关系的信息分享、传播以及获取平台。用户可以通过WEB、WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享。由于微博发展迅猛,微博文本已经形成了大规模积累,针对微博文本的研究已经成为了一个十分重要的课题。该文对微博文本进行了定义,阐述了微博文本研究的重要性,并从微博文本的不同应用领域出发,对微博文本的研究现状进行了综述,介绍了目前已经存在的微博文本数据集和应用系统。
引用
收藏
页码:21 / 27+42 +42
页数:8
相关论文
共 9 条
[1]   大规模短文本的不完全聚类 [J].
彭泽映 ;
俞晓明 ;
许洪波 ;
刘春阳 .
中文信息学报, 2011, 25 (01) :54-59
[2]   一种基于语义内积空间模型的文本聚类算法 [J].
彭京 ;
杨冬青 ;
唐世渭 ;
付艳 ;
蒋汉奎 .
计算机学报, 2007, (08) :1354-1363
[3]   面向变异短文本的快速聚类算法 [J].
黄永光 ;
刘挺 ;
车万翔 ;
胡晓光 .
中文信息学报, 2007, (02) :63-68
[4]  
短文本语言计算的关键技术研究[D]. 龚才春.中国科学院研究生院(计算技术研究所) 2008
[5]  
大规模短文本的分类过滤方法研究[D]. 吴薇.北京邮电大学 2007
[6]   Conversation Extraction in Dynamic Text Message Stream [J].
Wang, Le ;
Jia, Yan ;
Chen, Yingwen .
JOURNAL OF COMPUTERS, 2008, 3 (10) :86-93
[7]  
Tweetmotif: Exploratory Search andTopic Summarization for Twitter. B. O’’Connor,M. Krieger,D. Ahn. Proceedings of ICWSM . 2010
[8]  
Named Entity Recognition:Adapting toMicroblogging. B.Locke. University of Colo-rado . 2009
[9]  
Twit-ter Relevance Filtering via Joint Bayes Classifiersfrom User Clustering. A.L.Churchill,E.G.Liodakis,S.H.Ye. . 2010