随着互联网技术的快速发展,以网络媒体为代表的“新媒体”逐渐成为人们获取信息和交流的主要渠道。网络已经成为一把锋利的“双刃剑”,在提供了下情上达的便捷方式的同时,也对我国文化安全和政治安全构成了严重威胁。政府如何控制非常规突发事件的网络舆情,并在网络舆情分析的基础上,科学制定相应的预警、报道与反馈机制,将对安抚民心和维护社会秩序稳定起到积极的推动作用。
在过去网络舆情研究中,大多采用基于主题的聚类基础上考察相关评论规模的方法进行分析,往往忽视了对网民评论的情感因素的关注。通常是停留在热点话题、焦点话题发现的角度进行舆情分析,没有依据情感倾向性特性进行区分。本文尝试针对网络舆情中的文本倾向性分析技术做深入研究,根据网络舆情语料特性,通过机器学习的方法得到适合网络舆情的情感倾向性分析模型,进而对网络舆情的情感倾向性做出正确的分析。
本文基于网络舆情的相关分析理论和分析流程,构建了网络舆情语料库。通过对国内外相关研究文献成果进行归纳和整理,选取了文本情感倾向性研究的三种模型方法,然后经过实验对比分析,得到针对网络舆情最优的分析方法,即支持向量机方法。由于机器学习中涉及训练集和测试集,本文针对网络舆情探究了训练集中文本数量与情感分类准确率的关系;训练集中正、反面评论数量与分类准确率的关系。以上研究有利于提高情感分类的准确性、分类效率,降低分类成本。同时将得出的结论进一步应用到房地产舆情案例中,对出了2010年前5个月房地产网络舆情的趋势,通过分析给出了相应的建议。
本文针对网络舆情的情感倾向性进行了深入研究,一方面丰富了网络舆情的理论范畴与内容,具有一定的理论意义和价值;另一方面对于网络舆情的监控发展,具有一定的实践参考价值。