云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

全站加速_华为云服务登录手机版_稳定性好

小七 141 0

用SQL预测COVID-19大流行性增长

博客随着COVID-19病毒的不断传播,医疗集团和各类公司都面临着在不断增长的需求面前提供医疗服务的压力。健康数据是您了解数据如何帮助组织解决危机的窗口。COVID-19仍然是世界各国政府、医疗机构和企业面临的主要挑战。许多政府已经实行了封锁,企业已经关闭,各地的人们都在进行社会疏远,以减缓病毒的传播。在加利福尼亚州,州长加文·纽森下令近4000万加州人呆在家里,此前有预测说,如果没有这样的命令,该州近56%的居民可能在8周内感染上这种病毒。这样的预测是如何做出的?在这篇文章中,我们将使用SQL来预测COVID-19病例的数量。我们开始吧数据集约翰霍普金斯大学(JHU)维护着一个关于COVID-19的各种数据集的GitHub存储库,并将这些数据用于教育和学术研究。每日COVID-19报告数据在该存储库中以CSV形式提供。这个Kaggle存储库维护JHU数据集的聚合版本。让我们使用Sisense for Cloud Data Teams的CSV upload特性将这些数据导入到一个表中进行分析步骤1:准备数据我们要预测的是美国的病例数,所以让我们把数据过滤到"美国"地区,然后根据某一天确诊病例数对数据进行分组。让我们也为这个数据添加一个行号,它将用于以后的一些SQL分析。最后,让我们使用公共表表达式(commontableexpressions,cte)来设置它。具有美国案例(选择结束日期(观测日期)作为观察日期,总计(已确认)已确认病例从[科维德19号,2020年,03号,29号]哪里COUNTRYREGION="美国"分组依据观察日期),我们的案例(选择row_number()over(按1个顺序按观察日期划分)作为行编号, *从美国案例)第二步:计算大流行增长因子连续两天之间的大流行性增长因子(PGF)可通过将后一天的确诊病例数除以前一天的确诊病例数来计算第(N)天的PGF=第(N)天的病例数/第(N-1)天的病例数如3月28日确诊病例121478例,3月27日确诊病例101657例。3月28日的PGF为121478/101657=1.19。通过计算过去几天的平均PGF,我们将预测未来会有多少病例我们用另一个平均值来计算。这可以通过自加入我们在步骤1中设置的CTE来实现。为了执行这种自连接,我们在步骤1中为数据添加了一个行号。让我们用过去五天的平均增长系数来预测未来10天的病例数。10天值是可配置的,并通过日期范围过滤器传递,平均增长系数为(选择平均(当前确诊病例/ 先前确诊病例)作为平均增长系数从以"行"为货币的美国箱加入我们的案例,以排为上一行当前行编号= 上一行编号+1哪里当前观察日期>DATEADD(天,-5,[daterange_start])以及当前观察日期[日期范围开始时间]按观察日期排序限制1)现在我们已经有了初步的案例,我们准备对未来的案件数量作出一些预测。下面是它的SQL选择观察日期,确诊病例,第∗number()行(按观察日期按1顺序划分)作为日编号,四舍五入(起始病例*功率(平均增长因子,日数-1),0)作为预测病例,平均增长系数,启动案例从美国案例加入平均增长因子加入起始病例哪里[观察日期=日期范围]这将以以下格式输出数据如您所见,使用3月13日至3月18日的平均增长系数,我们预测了3月19日至3月28日的病例数。我们的模型预测3月28日大约有11.7万个病例。实际上,大约有12.1万个病例步骤4:创建可视化现在我们有了表格格式的数据,现在是时候创建一些可视化的例子来看看在整个时间段内实际和预测的案例数量是如何执行的。让我们画一个折线图,日期在X轴上,实际情况和投影情况在Y轴上这将产生如下图表。根据最近的预测,我们预计4月19日会有793000个病例。实际上,有759 000例确诊病例。这次确诊病例数少于预计病例数。这是一个很好的迹象,表明大流行的平均增长因子一直在下降我们将知道,当增长因素接近1时,大流行就要结束了。我们所能做的任何事情来减缓流感的传播,保持社会距离,经常洗手,消毒常用物品,并遵循国家和地方当局的指导方针,都有助于降低这种增长因素摘要使用几行SQL,我们准备了COVID-19要分析的数据,并根据这些数据建立了一个简单的预测,在不久的将来可能有多少COVID-19病例。这显示了我们手中的工具的强大功能,这些工具可以帮助我们今天进行数据分析。Sisense for Cloud Data Teams(以前是Periscope Data)使数据团队能够快速连接到云数据源,然后使用SQL、R和Python在几分钟内探索和分析数据。Govind Rajagopalan是Sisense的高级工程经理。他在不同公司、领域、团队和技术领域拥有超过15年的工程和管理经验。他很乐意教书,总是帮助队友提高自己的技能,并且喜欢改进自己的手艺标签:coronavirus | COVID-19 |数据准备|数据团队|针对云数据团队的Sisense | SQL