云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

美国服务器_台湾代理服务器_免费

小七 141 0

人口健康是指一组个体的健康结果,如何学习大数据,包括这些结果在群体¹中的分布。通过将大数据模型和分析应用程序应用于大型患者数据集(包括他们的设施停留、特定程序和服务、医生护理、,

这些应用程序的目标可以包括:

改善患者护理和遭遇体验(缩小护理差距)降低护理和服务的人均成本(包括为提供者节省成本)改善人群健康(更好的健康结果、疾病预防、延长寿命、与医疗机构和设施的更好体验)

我们将使用SAP Vora查看两个不同的人群健康用例。

给定一组面向患者的健康数据文件,我们将使用SAP Vora加载、探索、分析,通过查看两个不同的医疗保健人群用例来可视化我们的数据。

更准确地说,我们将从Hadoop分布式文件系统(HDFS)将数据加载到SAP Vora中,并在SAP Vora Modeler的帮助下创建持久的内存数据模型和数据视图。我们将利用多个数据源,使用sapvora关系引擎、sapvora图形引擎和sapvora文档库(Collection)来处理数据。因此,我们将使用全套SAP Vora发现、建模和可视化工具从数据中获得有意义的见解。

上图描述了数据流。我以前用过这个图形,但我喜欢,所以我会继续用它。但在本例中,我更新了图形以强调我们使用不同来源的不同类型的原始数据(CSV、JSG、JSON),并利用多个sapvora引擎。而且,虽然Zeppelin提供了一些基本的可视化级别,而且SAP Vora支持许多不同的高级可视化工具(SAP Lumira、Tableau和其他兼容的应用程序),但我们在本博客中使用SAP Vora中的本机功能进行可视化。图中的红色虚线显示了本博客中讨论的重点领域。

案例1:多设施患者群体的骨科手术服务和成本

我们的第一个医疗保健人群使用案例通过检查这些手术的患者遭遇数据来查看骨科手术(主要是膝关节或髋关节置换)及其相关服务。数据收集涵盖了大约两年的接触,包括每次接触的成本、设施和医生信息以及具体服务(例如,制药、治疗、手术、诊断、,等)和各自的费用。

可用信息:

患者遭遇(停留)由入院日期和出院日期定义。患者人口统计学有助于确定个人资料模式。遇到与程序、设施、医生和服务有关的事实(并由服务部门进一步分析)。服务成本根据程序、设施和医生使用遭遇来衡量,以汇总服务。

实施方法:

构建数据模型和视图,以表示数据的事实和维度。使用sapvora关系引擎来探索和查询数据。使用sapvoramodeler,利用多个数据源、聚合和过滤构建持久视图。使用SAP Vora数据浏览器配置可视化以创建按需图表和导出。

发现和分析想法:

与这些类型的程序相关的医药成本是多少?哪些膝盖系统的成本最高?每个设施最常见的服务是什么?哪个设施每次遭遇的平均成本最高?每项服务?比较平均和总费用的服务或遭遇由医生。检查与住院时间的相关性。

对于第一个用例,我们在逗号分隔的文件中收集了相关数据,因此第一步是绘制一个数据模型,它将帮助我们识别实体抽象和它们之间的关系。

在将这些原始文件加载到Hadoop中之后,我们可以创建Vora表指定sapvora关系引擎作为我们的数据源类型。创建Vora表可以通过多种方式完成,包括使用Spark Scala shell、Zeppelin笔记本、Vora SQL编辑器或Vora Modeler。

一旦这些表被加载到Vora的内存引擎中,我们就可以立即开始使用Modeler绘图从一个或多个表作为数据源来构建视图。视图允许我们合并表、添加计算值、聚合数据和过滤数据。如果结果视图被证明是有价值的,大淘客网,那么它可以作为一个报表保存,并且只要它的数据源保持不变,企业管理应用,它就会保持不变,因为SAP Vora将表元数据保存在自己的目录中。

创建视图时的一个好方法是问一个问题,然后,如果可能的话,从数据中构建一个有助于回答问题的视图。

问题:哪个医生每次遭遇的平均花费最高?

为了回答这个问题,我们将加入"遭遇"和"医师"模型,并根据每次遭遇的成本值使用平均聚合。

SAP Vora视图:遭遇\医师\外部参照数据来源:HC\u遭遇,HC\u医师

我们可以直接使用Modeler的数据预览来绘制我们的数据。

提示:Modeler(版本1.4.14)中的数据预览仅限于前1000条记录。要无限制地浏览和绘制数据,请改用数据浏览器。

查看模式:

报告标题:医生的平均遭遇成本

数据预览窗格允许我们配置图表以可视化数据。在这里,我们看看条形图和面积图,显示了医生的平均遭遇成本(Y轴)(X轴)。