基于分布式计算的网络舆情分析系统的设计

被引:5
作者
何忠育
王勇
王瑛
陈新
廖朝辉
机构
[1] 广东工业大学计算机学院
关键词
分布式计算; Hadoop MapReduce; 舆情分析;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
本文提出了一种基于分布式计算的网络舆情分析系统,通过利用Hadoop的分布式存储和计算框架,基于K-means和Canopy两种聚类算法,设计了MapReduce聚类算法,支持了高性能的并行计算,实现了高效的舆情分析和预警。
引用
收藏
页码:19 / 22
页数:4
相关论文
共 9 条
[1]   基于聚类的网络舆情热点发现及分析 [J].
王伟 ;
许鑫 .
现代图书情报技术, 2009, (03) :74-79
[2]   多文档自动文摘中的特征组合优化 [J].
刘茂福 ;
李淑君 ;
金可佳 ;
张晓龙 .
计算机系统应用, 2008, (08) :59-63
[3]   面向网络演化信息的动态文摘方法研究 [J].
张瑾 ;
许洪波 ;
程学旗 .
计算机学报, 2008, (04) :696-701
[4]   一种全自动生成网页信息抽取Wrapper的方法 [J].
梅雪 ;
程学旗 ;
郭岩 ;
张刚 ;
丁国栋 .
中文信息学报, 2008, (01) :22-29
[5]   基于监督学习的中文情感分类技术比较研究 [J].
唐慧丰 ;
谭松波 ;
程学旗 .
中文信息学报, 2007, (06) :88-94+108
[6]   基于类别空间模型的文本倾向性分类方法 [J].
李艳玲 ;
戴冠中 ;
朱烨行 .
计算机应用, 2007, (09) :2194-2196
[7]   基于浅层分析的多文档自动文摘技术 [J].
张姝 ;
赵铁军 ;
郑德权 ;
杨沐昀 .
哈尔滨工业大学学报, 2007, (07) :1102-1105
[8]   基于语义理解的文本倾向性识别机制 [J].
徐琳宏 ;
林鸿飞 ;
杨志豪 .
中文信息学报, 2007, (01) :96-100
[9]  
一种改进的k-means文档聚类初值选择算法[J]. 刘远超,王晓龙,刘秉权.高技术通讯. 2006 (01)