项目地址:
PC端:https://www.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6
移动端:http://www.arcgis.com/apps/opsdashboard/index.html#/85320e2ea5424dfaaa75ae62e5c06e61
Tips:
·日访问量曾达20亿次、现已成为权威信源的“约翰·霍普金斯大学新冠病毒病例数据”,最开始只是霍普金斯大学的小项目:一个由两名中国博士生主导的小项目,早期甚至要依靠手动更新。
·该数据可视化项目的开发者,包括了两名约翰·霍普金斯大学系统科学与工程中心一年级博士生董恩盛和杜鸿儒。
·项目的成功,一方面在于其数据更新及时,另一方面也因为其优秀的展现形式——交互式“仪表盘”(dashboard)。事实证明,这一数据可视化方式非常适合疫情监控。
·截至目前,这个项目并未同美国卫生部门有直接合作,数据来源于公开发布的卫生部门数据以及媒体报道。
关注国际疫情的读者一定对这段话不陌生:“ 美国约翰·霍普金斯大学最新统计数据显示,美国新冠肺炎确诊病例已超过X万例……”
这个实质上的第三方数据整合项目,却在时效性、直观性等方面完爆美国疾控中心(CDC)。不少电视台在播报疫情新闻时,直接对着大屏幕上的约翰·霍普金斯大学数据“仪表盘”解读。甚至,美国副总统彭斯在卫生部门开会时,背后大屏幕显示的都是约翰·霍普金斯大学的“仪表盘”。
这个每天被新华社、美联社、法新社、BBC等中外媒体作为权威信源引用的数据平台,在刚诞生时,只是个霍普金斯大学的小项目;经过不断升级,才造就了今天的权威。
“仪表盘”的“1.0版本”
记录新冠肺炎从发生到人类战胜它的过程
4月2日,项目的其中一位开发者董恩盛在中国地理信息产业协会主办的一场网络直播中说,产生做这个项目的想法是在1月20日。当天是马丁路德金日,美国放假,董恩盛在家里刷新闻,觉得“疫情蛮严重的”,因为之前有相关的研究经验,他想到了去收集数据,以“记录新冠肺炎从发生到人类战胜它的过程”。
1月21日,董恩盛同导师劳伦·加德纳(Lauren Gardner)见面,决定收集数据,然后去做进一步研究。就这样,董恩盛在21日花了六七个小时把当日的数据整理出来。22日,“仪表盘”项目上线。劳伦·加德纳在Twitter上转发了这个项目。
可以看到,此时这个项目的地图上还只有中国和周边地区。相对于今天看到的“仪表盘”,这个地图还很简陋。而随着疫情继续发展,“仪表盘”逐渐升级。特别是在美国、欧洲出现暴发态势后,日访问量曾达到20亿次,甚至有几次服务器宕机。
击败官方的第三方数据
几乎全天实时维护地图
最开始,“仪表盘”并没有现在这么出色。董恩盛在直播中说,从1月22日至31日,“仪表盘”的所有数据收集和处理都是手动完成,“每天两次的更新,通常是在美国东部时间早、晚进行。”
随着疫情的发展,手动更新已然不可能。董恩盛在直播中表示,从2月1日,数据采集系统升级为半自动更新,“抓取的主要数据来源是中国国内的医学自媒体丁香园,而丁香园的数据来源于国家卫健委和各省市区的卫健部门。紧盯丁香园,就能确保‘仪表盘’在中国大陆数据更新的及时性,每15分钟更新一次”。
而对于中国大陆以外的数据,丁香园的更新相对并不及时。这就需要对其他数据来源,包括官方机构、新闻等进行自动监控和手动更新。
到目前为止,根据约翰·霍普金斯大学“仪表盘”官方介绍,其数据来源包括:世界卫生组织(WHO),中、美、欧的官方卫生和疾控部门,各地媒体,以及第三方数据平台如丁香园、worldometers、一亩三分地(1point3acres)等。
董恩盛在直播中还表示,到目前为止项目没有同美国官方卫生部门有直接合作。事实上,从其数据来源上看,均来自公开渠道。
另一方面,美国在联邦政府层面的数据发布迟缓,使得各媒体机构不得不转向第三方数据整合平台。
例如,美国疾病预防控制中心(CDC)报告疫情的页面显著提示:数据只截至到当天下午4点,周六周日的数据更是将延迟到周一才更新。而约翰·霍普金斯大学的“仪表盘”,通过人工和自动更新相结合,目前已经可以做到“几乎全天实时维护地图”。
这也就意味着,在时效性上,CDC的参考意义已经远远落后于其他第三方数据平台。
另一方面,不仅仅是媒体,甚至美国卫生部门本身,也更依赖约翰·霍普金斯大学的“仪表盘”而非CDC。例如,美国副总统彭斯在卫生部门开会时,背后大屏幕显示的就是 “仪表盘”。
在约翰·霍普金斯大学专家向美国国会介绍新冠病毒相关信息时,劳伦·加德纳表示,“仪表盘”的流行,反映了“人们对可靠、可信、客观信息的巨大需求”。
GIS系统的典型应用
模拟疫情动态科学指导防疫
能够短时间迅速搭起“仪表盘”,只有依靠成熟的解决方案。约翰·霍普金斯大学采用了ESRI公司的ArcGIS系列开发工具。这是一家业内知名的地理信息系统(Geographical Information System, GIS)提供商。
GIS技术可以把地图这种独特的视觉化效果和地理分析功能与一般的数据库操作集成在一起,已经在地理、水文、交通、测绘、卫生等很多行业上得到成功应用。
特别是结合病例统计数、时间和地理信息形成的疫情地图,是GIS系统非常生动的应用。
类似的应用在全球范围内还有不少。比如中国疾控中心联合ESRI推出的“新型冠状病毒感染的肺炎疫情分布系统”(下图),和约翰·霍普金斯大学“仪表盘”功能近似。
还有其他类型的GIS应用。例如国际民用航空组织(ICAO)制作的3DFX分散地图(下图)。该图追踪了20个设有筛查中心的美国机场的航线,便于分析病毒通过航空器传播的路径。
2月19日的顶级医学学术杂志《柳叶刀》,介绍了约翰·霍普金斯大学的“仪表盘”。这篇《柳叶刀》短文指出,约翰·霍普金斯大学“仪表盘”的本意,并非仅仅为媒体和公众提供疫情可视化产品。在学术上,研究团队的更重要目标是通过建立完善的数据,进而模拟疫情动态,从而科学地指导防疫工作。
【记者】王诗堃
【统筹】张志超
【策划】郑幼智 吕虹
【作者】 王诗堃