随着 COVID-19 数据集的日益普及,全球技术开发人员为流行病学家和数据科学专家们创建了一堆分析工具,来迅速汇总和分析 COVID-19 大流行的数据,让这次新型冠状病毒爆发成为有史以来最直观的一次。通过这些宏观、全面、又详细的可视化数据集,我们每一个“吃瓜网民”都可以算得上半个流行病学家。第一个数据分析仪表板和汇合工具出现在 COVID-19 爆发后不久。
该仪表板由约翰·霍普金斯大学提供,成为了目前重要的数据源,它将来自世卫组织、疾病预防控制中心、ECDC、NHC、DXY、1point3acres、Worldometers.info、BNO、国家政府卫生部门以及当地媒体报道的数据进行汇合,形成可视化数据展示。
约翰·霍普金斯大学的 COVID-19 全球仪表板,目前全球还有许多优秀的可视化分析数据集,比如:利用约翰霍普金斯大学 GitHub 存储库的数据,Tableau 公司发布了一个入门仪表盘,使其在 Tableau Public 上可用,提供各种可视化模板,也设置了数据集的 .hyper、.tde 和 CSV 版本,便于访问。
美国环境系统研究所公司(Esri)通过地图和地理定位技术应用于 COVID-19 的跟踪,此外还对 COVID-19 病例数据进行了本地化,并与来自权威医疗机构的病床可用性数据相结合。Facebook 和卡内基梅隆大学( Carnegie Mellon )将用户数据匿名化,以追踪全美范围内的 COVID-19 状况。
《大西洋月刊》( Atlantic )的作者们正在使用开源软件收集来自多个来源的数据。GitHub 有一系列关于新型冠状病毒的数据集,而像 data.world 和 Kaggle 这种竞赛、预测和可视化的平台也有新型冠状病毒的数据集。Reddit 有个专题专门展示一群爱好者和数据科学家的可视化成果,Our World in Data 也对 COVID-19 的研究和数据进行了概述。
数据服务公司 Starschema 已经列出了一个免费的数据集,旨在成为 COVID-19 病例发病率和死亡率的唯一真实数据来源,这些数据可以用人口密度和地理位置来扩充。IBM 汇总了 COVID-19 数据,并将其与 Weather Channel 应用程序进行集成,该应用程序将天气数据和本地新型冠状病毒事件融合在一起。
通过其天气频道应用,IBM 的子公司可以将相关的 COVID-19 数据提供给 3 亿的活跃用户。在谷歌和微软必应( Microsoft Bing )的共同努力下,IBM 可视化技术将得以发展,把 COVID-19 数据带给大众。
ESO 是一家数据软件公司,专注于研究 EMS、火灾和医院的急救人员的情况,以追踪全美各地的急救数据,该数据集收集了从院前到医院的反应,收集自全美 2600 家 EMS 机构,但不包括加州。健康指标与评估研究所( Institute for Health Metrics and Evaluation )也有一组数据,关注医院病床的使用情况,以及重症监护床和呼吸机的需求。
C3.ai 创建了一个统一的数据集,公开所有可用的 COVID-19 数据集。不久前,为了对抗蔓延全球的新冠肺炎疫情,帮助研究者、政策制定者、医疗工作者和普通民众更深入地了解病毒和疫情,清华大学联合中国工程科技知识中心、清华大学附属北京长庚医院、阿里巴巴智能计算实验室、北京智源人工智能研究院数据开放研究中心、搜狗搜索、智谱.AI 共同上线了“新冠肺炎( COVID-19 )开放数据源”。
新冠肺炎( COVID-19 )开放数据源,自疫情发端即致力于收集来自世界各地各种类型的相关开放数据,并保持持续更新。数据源涵盖流行病研究、知识、媒体和政策等多个领域,目前已收集 194 条开放数据源。
感兴趣的“业余流行病学家”们,可以复制网址( https://www.aminer.cn/data-covid19/ )或点击文末阅读原文,一键直达新冠肺炎( COVID-19 )开放数据源专题页面。