云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

云主机_灵魂摆渡黄泉百度云资源_便宜的

小七 141 0

我已经在博客第一部分介绍了SAP HANA Vora环境的基本情况。

这里我将更详细地介绍SAP HANA Vora版本1.2背后的体系结构。

Hadoop环境是一个集群,其中数千个节点可以形成存储、访问和分析大型结构化数据以及复杂数据的平台,非结构化数据。SAP-HANA-Vora解决方案是作为Hadoop生态系统之上的另一项服务运行的。

如果您曾经使用过Hadoop,数据挖掘和大数据,那么您可能知道该平台的体系结构。对于那些刚接触Hadoop的人来说,以下是一些基本信息,有助于理解SAP HANA Vora是如何被放置在Hadoop环境中的。

Hadoop是许多开源组件的组合,这些组件协同工作以支持大型数据集的分布式处理。数据分布在集群中的多个节点上,什么是大数据技术,称为Hadoop分布式文件系统(HDFS)。基本上,这些节点只是运行Linux版本的较便宜的商品系统。其他主要组件是YARN,它管理所有Hadoop集群资源,如内存分配;Apache Spark;Zookeeper,它是管理Hadoop上运行的所有服务的协调器;HBase数据库,它是一个Hadoop数据库,运行在这些节点集群上。

Hive SQL,Spark SQL,和Pig脚本是可以用来从集群的HDFSs查询Hadoop数据的查询语言(请参阅第一部分中的图1)。这些工具支持跨多个节点的集群对大型结构化和非结构化数据集进行分布式处理,有时会运行到数千个节点。Apache Ambari(用于HDP分发)用于向集群中的任意数量的节点提供服务。

SAP HANA Vora作为一个服务在平台上运行。saphanavora实例将数据保存在内存中,提高了apachespark的性能。此实例包含SAP HANA Vora引擎和Spark Worker,它们都安装在保存要处理的数据的节点上(在集群中称为数据节点)。saphanavora与Spark内存数据处理引擎交互以提高性能。SAP HANA Vora支持Hadoop的分析过程,并通过允许在大数据之上构建层次结构来实现层次结构报告。

图1显示了SAP HANA Vora如何在Hadoop平台中与Apache Spark框架一起工作的示例。

图1。Hadoop、Apache Spark和SAP HANA Vora的体系结构

SAP HANA Vora Components

SAP HANA Vora包含两个主要组件

SAP HANA Vora在最新的SAP HANA Vora版本1.2中启动了一些服务,如元数据编目、发现和分布式日志记录,以与大数据平台协同工作。让我们看一下每个服务的详细信息,以及它们在执行过程中如何协同工作。

可以使用集群主仪表板上的Apache Ambari管理服务。

图2 Apache Ambari管理屏幕中显示的SAP HANA Vora服务

SAP HANA Vora Base

SAP HANA Vora Base组件不是服务,但是它包含了所有必要的库和二进制文件。它是帮助所有SAP HANA Vora组件有效工作的基本工具集。此组件安装在群集中的所有节点上。

SAP HANA Vora目录服务器

SAP HANA Vora目录服务器在SAP HANA请求元数据时提供必要的信息,它通过与维护元数据持久性的DLog服务器通信来标识元数据。SAP HANA Vora目录服务器允许SAP HANA存储和检索通用的分层和版本化键值,这是同步并行更新所需的。

目录充当其他元数据存储(如HDFS NameNode)的代理,并在本地缓存其元数据以获得更好的性能。它还根据数据块的位置确定存储在HDFS上的给定文件的首选位置。

VORA发现服务

SAP HANA VORA的主要支持组件是发现服务。这将管理群集中的服务端点,如SAP HANA Vora Catalog、SAP HANA Vora engines、AppServer(为SAP HANA Vora Tools等web应用程序提供运行时)、Zookeeper和SAP HANA Vora分布式日志(DLog)。发现服务以服务器模式或客户端模式安装在所有节点中。在整个集群中,至少有三个节点需要以服务器模式运行,而服务可以在其余节点中以客户机模式运行。

SAP HANA Vora发现服务使用Consor发现服务(来自HashiCorp),管理所有服务注册并对其运行状况检查。可以使用浏览器从端口8500上的任何发现服务器或客户端节点访问领事发现服务。从这个(web)页面,您可以监视注册到consur Discovery服务的所有服务的运行状况,以及每个服务的详细信息,例如群集中任何特定节点提供的服务类型。SAP HANA Vora发现服务要求Zookeeper、Hadoop的HDFS和SAP HANA Vora Base可用,以便提供服务。

SAP HANA Vora DLog(发现日志)服务

SAP HANA Vora DLog服务是为SAP HANA Vora目录提供元数据持久性的管理器。DLog服务需要运行SAP HANA Vora发现服务才能工作。根据可用节点的数量,需要一台DLog服务器,但最多可以有五台DLog服务器。

SAP HANA Vora Thrift server

SAP HANA Vora Thrift server是一个网关,与安装在单个节点上的配置单元Java数据库连接(JDBC)驱动程序兼容。它安装在未部署发现服务、DLog和目录服务的节点上,通常称为跳转节点或边缘节点。当前端工具(如SAP Lumira)建立通用JDBC连接以在SAP HANA Vora或Apache Spark的数据上运行可视化时,将使用此服务。

SAP HANA Vora工具