基于互联网搜索数据的流感监测模型比较与优化

被引:9
作者
王若佳 [1 ]
李培 [2 ]
机构
[1] 北京大学信息管理系
[2] 天津图书馆
关键词
流感; 搜索引擎; 百度指数; 监测模型;
D O I
10.13266/j.issn.0252-3116.2016.18.015
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
[目的 /意义]分析国内互联网搜索数据和我国流感疫情的相关性,探讨利用搜索数据辅助流行病监测的应用可能,为相关搜索引擎和疾病防控中心提供参考。[方法 /过程]通过分析百度中文搜索词搜索情况和我国流感活动情况的相关性,选择合适的搜索关键词,构建并比较一元线性回归、多元线性回归、主成分回归及人工神经网络模型,选出最优模型;引入官方发布的流感监测历史信息,进行模型优化。[结果 /结论]多元线性回归和人工神经网络模型具有更好的拟合优度,其中多元线性回归的精度更高;主成分回归模型在理论上可以减少变量之间的共线性,但实践证明无论是其拟合效果还是监测效果相对于多元回归模型来说都有所下降;历史数据和搜索数据包含的信息具有一定程度的互补性,综合使用两种数据具有最好的监测效果。
引用
收藏
页码:122 / 132
页数:11
相关论文
共 5 条
[1]   百度指数和微指数在中国流感监测中的比较分析 [J].
鲁力 ;
邹远强 ;
彭友松 ;
李肯立 ;
蒋太交 .
计算机应用研究, 2016, 33 (02) :392-395
[2]   基于互联网搜索数据研究全球高致病性禽流感病毒H5N1的暴发监测 [J].
李锐 ;
孙利谦 ;
熊成龙 ;
胡艺 ;
林燧恒 ;
张志杰 ;
姜庆五 .
中华疾病控制杂志, 2015, (08) :773-777
[3]   互联网搜索数据与流感预警 [J].
李锐 ;
王增亮 ;
张志杰 ;
高杰 ;
姜庆五 .
中华流行病学杂志, 2013, (01) :101-103
[4]  
Reassessing Google Flu Trends Data for Detection of Seasonal and Pandemic Influenza: A Comparative Epidemiological Study at Three Geographic Scales[J] . Donald R. Olson,Kevin J. Konty,Marc Paladini,Cecile Viboud,Lone Simonsen. PLOS Computational Biology . 2013 (10)
[5]  
Analysis of Web Access Logs for Surveillance of Influenza[J] . Marius Fieschi,Enrico Coiera,Yu-Chan Jack Li,Heather A. Johnson,Michael M. Wagner,William R. Hogan,Wendy Chapman,Robert T Olszewski,John Dowling,Gary Barnas. Studies in Health Technology and Informatics . 2004