融合百度指数的流感预测机理与实证研究

被引:22
作者
王若佳 [1 ,2 ]
机构
[1] 北京大学信息管理系
[2] 北京大学海洋研究院
关键词
流感预测; 百度指数; 神经网络; 支持向量机; 多元线性回归;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究]; R511.7 [流行性感冒];
学科分类号
摘要
本文通过挖掘网络搜索数据与我国流感疫情的在内在机理,利用关键词的时序特征实现了较为精准的提前预测。研究首先从信息行为、信息搜寻行为等理论概念出发,对百度指数与流感病例数据之间的逻辑关系进行探讨,建立理论框架;然后以理论框架为基础,用范围选词法对百度搜索词进行初步筛选,并利用互相关分析选出具有先行性质的关键词,用于构建预测模型;最后,对比融合百度指数的三种预测模型,评估其预测效果。互相关分析结果大致符合本文提出的逻辑框架,可提前十周预测流感疫情的关键词内容和流感疫苗相关;提前一周的关键词多涉及流感的症状表现;而同步类关键词多为常用搜索词或治疗方法。模型对比结果显示,多元线性回归模型、支持向量机模型和神经网络模型都能有效地进行流感预测,无论提前十周还是提前一周,支持向量机的效果最好。
引用
收藏
页码:206 / 219
页数:14
相关论文
共 17 条
  • [1] 基于互联网搜索数据的流感监测模型比较与优化
    王若佳
    李培
    [J]. 图书情报工作, 2016, 60 (18) : 122 - 132
  • [2] 基于支持向量机的浙江省流感样病例预警模型研究[J]. 卢汉体,李傅冬,林君芬,何凡,沈毅.浙江大学学报(医学版). 2015 (06)
  • [3] 基于互联网搜索数据研究全球高致病性禽流感病毒H5N1的暴发监测
    李锐
    孙利谦
    熊成龙
    胡艺
    林燧恒
    张志杰
    姜庆五
    [J]. 中华疾病控制杂志, 2015, (08) : 773 - 777
  • [4] 网络搜索关键词时序变化特征研究——以H7N9禽流感关键词实验为例
    卢洪涛
    李纲
    [J]. 情报杂志, 2014, 33 (11) : 175 - 180
  • [5] 基于网络信息搜索的旅游需求预测——来自黄金周的证据
    王炼
    贾建民
    [J]. 系统管理学报, 2014, 23 (03) : 345 - 350+358
  • [6] 基于互联网搜索数据的中国流感监测
    李秀婷
    刘凡
    董纪昌
    吕本富
    [J]. 系统工程理论与实践, 2013, (12) : 3028 - 3034
  • [7] 基于谷歌趋势的乙型肝炎预测模型
    杨艳红
    曾庆
    赵寒
    易娟
    李勤
    夏宇
    [J]. 上海交通大学学报(医学版), 2013, 33 (02) : 204 - 208
  • [8] 网络搜索数据与CPI的相关性研究
    张崇
    吕本富
    彭赓
    刘颖
    [J]. 管理科学学报, 2012, 15 (07) : 50 - 59+70
  • [9] 时间序列分析在流感疫情预测预警中的应用
    朱猛
    祖荣强
    霍翔
    鲍昌俊
    赵杨
    彭志行
    喻荣彬
    沈洪兵
    陈峰
    [J]. 中华预防医学杂志, 2011, (12)
  • [10] 健康信息需求研究的内容与意义
    张馨遥
    [J]. 医学与社会, 2010, 23 (01) : 51 - 53