基于文本分类的SNS社区发布订阅技术研究

被引:0
作者
兰瑞
机构
[1] 华中科技大学
关键词
社交网站; 发布订阅; 文本分类; 动态主题聚类;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
Facebook等社交网站日益流行,人们获取信息的方式也随之发生了很大的变化。从原来访问门户网站被动接受编辑们的推荐,到现在更依赖于社交网站上面志趣相投的好友的分享。社交网站上面日益增多的信息和日益多样化的用户群体对社区的运营者提出了新的挑战:如何提供给用户多样化的访问方式让他们随时随地能够在社交网站上发布新的信息;如何在大量的无序信息中找出用户感兴趣的内容并呈现给他们。 结合实际运行的华中科技大学“服务计算技术与系统教育部重点实验室”暨“集群与网格湖北省重点实验室”师生社交网站“穿过丛林”的需求,从为用户提供多种访问方式和为用户呈现感兴趣的内容这两个目的出发,进行了相关技术研究,开发了一套可以通用于类似社交网站的发布订阅框架:1)通过对多种通信方式的研究,支持多样化的访问手段,包括但不限于手机短信、PC客户端、网页等,使用户可以随时随地发布和接收动态;2)引入发布订阅技术,为用户提供分主题订阅功能,并在kNN文本分类算法的基础上引入用户反馈机制,提高分类的准确性,并使分类结果契合特定社区的实际情况;3)提出动态主题聚类算法,帮助用户获取与订阅主题类似的其他主题下的信息。通过以上方式,在好友关系之外提供了新的信息流动渠道,使用户可以根据自己关注的兴趣从社区大量的信息中实时、准确地获取到自己想要的信息。 经过实际部署和实验测试,提供的多种访问手段可以稳定正常地提供服务,基于文本自动分类和动态主题聚类的信息发布订阅机制对文本的自动分类发布准确度达到80%以上,处理时延较小,满足日常使用需求。
引用
收藏
页数:57
共 5 条
[1]
文本分类中特征向量空间降维方法研究 [D]. 
陈慧芳 .
东南大学,
2005
[2]
Field independent probabilistic model for clustering multi-field documents [J].
Zhu, Shanfeng ;
Takigawa, Ichigaku ;
Zeng, Jia ;
Mamitsuka, Hiroshi .
INFORMATION PROCESSING & MANAGEMENT, 2009, 45 (05) :555-570
[3]
A Representation and Classification Scheme for Tree-Like Structures in Medical Images: Analyzing the Branching Pattern of Ductal Trees in X-ray Galactograms [J].
Megalooikonomou, Vasileios ;
Barnathan, Michael ;
Kontos, Despina ;
Bakic, Predrag R. ;
Maidment, Andrew D. A. .
IEEE TRANSACTIONS ON MEDICAL IMAGING, 2009, 28 (04) :487-493
[4]
Unraveling the taste fabric of social networks [J].
Liu, Hugo ;
Maes, Pattie ;
Davenport, Glorianna .
INTERNATIONAL JOURNAL ON SEMANTIC WEB AND INFORMATION SYSTEMS, 2006, 2 (01) :42-71
[5]
Design and evaluation of a wide-area event notification service [J].
Carzaniga, A ;
Rosenblum, DS ;
Wolf, AL .
ACM TRANSACTIONS ON COMPUTER SYSTEMS, 2001, 19 (03) :332-383