R语言环境下的文本可视化及主题分析——以社会服务平台数据为例

被引:14
作者
吴丹露
魏彤
许家清
机构
[1] 宁波工程学院
关键词
R软件; 数据可视化; 主题分析;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
开源R软件集成了各种数据分析和可视化方法,具备强大的数据分析功能和良好的可扩展性,适用于数据挖掘[1]。本文结合某社会服务平台的数据挖掘案例,给出了R软件在挖掘过程中各主要阶段的应用方法。数据准备阶段包括数据选择与预处理应用;挖掘建模阶段给出了可视化及主题分析[2]挖掘应用。并把所述的方法应用在一个真实的社会服务数据集上。
引用
收藏
页码:19 / 25
页数:7
相关论文
共 6 条
[1]
基于LDA模型的文本分割 [J].
石晶 ;
胡明 ;
石鑫 ;
戴国忠 .
计算机学报, 2008, (10) :1865-1873
[2]
基于PLSA模型的文本分割 [J].
石晶 ;
戴国忠 .
计算机研究与发展, 2007, (02) :242-248
[3]
统计建模与R软件.[M].薛毅,陈立萍编著.清华大学出版社.2007,
[4]
数据挖掘原理与算法.[M].毛国君等编著;.清华大学出版社.2005,
[5]
数据挖掘技术.[M].陈文伟等著;.北京工业大学出版社.2002,
[6]
Relevance models for topic detection and tracking..Lavrenko V;Allan J;DeGuzman E; et al;.Proceedings of the second international conference on Human Language Technology Research.2002,