基于语料库方法的舆论热词数据库的构建——以2011—2013年全国两会舆情中心词和关联词的发现与分析为例

被引:10
作者
喻国明 [1 ,2 ]
机构
[1] 中国人民大学新闻学院
[2] 中国人民大学新闻与社会发展研究中心
关键词
大数据; 舆情热词; 语料库; 舆情分析;
D O I
暂无
中图分类号
H136 [现代词汇]; G206 [传播理论];
学科分类号
摘要
用于舆情分析的基于应用语言学领域的语料库分析方法,是通过对舆情热词的历时性分析,建立社会舆情热词数据库。在此基础上,引入大数据中的样本挖掘,通过基于中心词的挖掘和关联词的发现,找出舆情热词分析的两个维度。此研究构建了一个小型的基础语料库,文本的内容选择从2011——2013年的《中国社会舆情年度报告》重要舆情热点事件中进行选取,通过大数据的分析,找到2011——2013年全国两会舆情热词中的中心词和关联词。
引用
收藏
页码:54 / 60
页数:7
相关论文
共 3 条