Google与哈佛全球健康研究所合作,今天发布了COVID-19公共预报,这是一组模型,可提供美国未来14天的COVID-19病例,死亡,ICU使用率,呼吸机可用性以及其他指标的预测县和州。这些模型在约翰·霍普金斯大学,笛卡尔实验室和美国人口普查局等公共数据上进行了训练,谷歌表示,将继续在哈佛大学合作者的指导下对其进行更新。
Google表示,COVID-19公共预测旨在作为医疗,公共部门和其他受影响组织的急救人员的资源,为即将发生的事情做准备。从理论上讲,它们允许对每个县进行有针对性的测试和公共卫生干预措施,从而从理论上增强使用它们来应对迅速发展的COVID-19大流行的人员的能力。例如,医疗保健提供者可以将预测的病例数作为数据点纳入PPE,人员配备和计划的资源规划中。同时,州和县卫生部门可以使用感染的预测来帮助制定检测策略并确定可能爆发的地区。
谷歌表示,为了创建COVID-19公共预测,其研究人员开发了一种新颖的时间序列机器学习方法,该方法将AI与聪明的流行病学基础相结合。通过设计,模型在公共数据上进行训练,并利用一种体系结构,该体系结构使研究人员可以深入研究模型已经确定的关系并解释为什么做出某些预测。还对它们进行了评估,以确保对有色人种的预测(不会严重歪曲或以其他方式引起误解)-有色人种受COVID-19的打击最严重,病例和死亡的发生率不成比例。
Google研究人员在对COVID-19预测模型的公平性分析中写道:“与主要在非裔美国人,西班牙裔美国人和白人县的比较模型相比,我们的模型产生的有意义的绝对误差和标准化(相对)误差要低得多。” “我们的模型针对美国所有县的高精度进行了优化,以为大多数社区提供最佳的总体预测。”
作为服务的每月1TB免费套餐的一部分,可以在BigQuery中免费查询COVID-19公共预测,也可以将其下载为逗号分隔的值文件(CSV)。此外,可通过Google的Data Studio仪表板及其国家响应门户网站访问它们。
谷歌表示,针对数据集的查询中处理的所有字节都将清零,但是与数据集结合的数据将按正常费率计费,以防止滥用。9月15日之后,对预测集的查询将恢复为正常的Google Cloud结算费率。
在发布Google的COVID-19公共数据集程序之前,发布了COVID-19公共预测程序,该程序托管与危机有关的公共数据集的存储库,并使它们更易于访问和分析。COVID-19公共数据集计划中的语料库包括约翰·霍普金斯系统科学与工程中心(JHU CSSE)数据集,世界银行的全球健康数据和OpenStreetMap数据,所有这些数据均免费存储在Google Cloud上。