云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

百度云_云服务器搭建教程_哪个好

小七 141 0

百度云_云服务器搭建教程_哪个好

作为SAP HANA SPS10智能数据访问新功能简介系列的一部分,SAP HANA Academy的Tahir Hussain(Bob)Babar浏览了一系列黑板,免费云服务器,从较高的层次概述了SAP HANA与Hadoop的连接在最近的SAP HANA SPS版本中取得的进展。Bob还介绍了我们现在如何使用SAP HANA SPS10的新SAP HANA Spark控制器连接到Hadoop。查看下面Bob的视频。

也可以查看此SAP HANA Academy播放列表,了解有关SAP HANA Smart Data Access的更多信息。

(1:30–5:50)在SAP HANA SPS07中连接Hadoop到SAP HANA的概述

自SAP HANA SPS07以来,我们已经能够使用SAP HANA Smart Data Access将SAP HANA连接到Hadoop。通过在Linux服务器上安装SAP HANA,我们可以在两个系统之间连接数据。假设在saphana系统中有一个包含大量表的模式,并且您希望检索存储在HDFS(Hadoop分布式文件系统)中Hadoop中的大量数据。有几种不同的方法来访问数据,包括MapReduce或Spark。这些引擎用于并行处理和从大型数据集中获取数据。HiveQL用于访问HDFS中的数据。SAP HANA Studio用于作为客户端访问SAP HANA。

在SAP HANA SPS07中,您可以使用SAP HANA Studio从SAP HANA连接到Hadoop系统。为此,您使用putty或ssh在saphanalinux服务器上安装了各种文件(UNIXODBC驱动程序和Hive驱动程序)。Hive驱动程序将连接到Hadoop服务器上的Hive,然后最终通过MapReduce连接到HDFS系统上的文件。

然后使用SAP HANA Studio的最终用户可以在SAP HANA Linux服务器上构建远程源和虚拟表。然后,该虚拟表将通过UNIXODBC连接,然后通过Hive驱动程序连接到Hadoop系统上的Hive以运行MapReduce。在此之后,您就可以使用SAP HANA和Hadoop系统中的单个SQL语句数据进行连接。

这很有效,但非常麻烦。另外,现在使用SAP HANA云平台,您还无法访问所有这些SAP HANA代理所在的Linux服务器。

(5:50–7:00)在SAP HANA SPS08中连接Hadoop到SAP HANA的概述

在下一版本SAP HANA SPS08中,代替使用MapReduce,您可以使用Spark(MapReduce的更新版本)。现在,在SAP-HANA-Linux服务器上安装了Spark驱动程序之后,您可以通过Hive连接,使用Spark访问HDFS中的数据。由于Spark over MapReduce的技术进步,连接速度更快。此外,连接路径在SAP HANA Studio中使用几乎相同的过程构建。

(7:00–8:15)在SAP HANA SPS09中连接Hadoop到SAP HANA概述

在SAP HANA SPS09中,无需安装UNIXODBC驱动程序和Spark/Hive驱动程序,也无需在SAP HANA Linux服务器上执行任何工作。相反,MapReduce归档文件的这个新概念是在SAP HANA Studio中使用Java代码创建的,关于大数据,然后部署在SAP HANA Linux服务器上。MapReduce存档文件随后连接到Hadoop系统中的MapReduce,然后最终连接到HDFS。

SPS09中发布的另一个概念是虚拟UDF(用户定义函数)。使用虚拟udf,什么叫大数据,用户可以直接连接到HDFS并绕过MapReduce。用户将直接在SAP HANA Studio中创建这些对象。

(8:15–10:00)在SAP HANA SPS10中连接Hadoop到SAP HANA概述

现在使用SAP HANA SPS10,除了创建远程数据源之外,物联网断路器,不需要从SAP HANA Studio部署任何内容。所有的工作都是在Hadoop集群上执行的。基本上,saphanaspark控制器是直接在Hadoop集群上安装、配置和组装的。然后,您可以使用YARN Shuffle和Spark程序集将SAP HANA连接到HDFS系统。

无需在SAP HANA Linux服务器中执行任何操作,因为Hadoop系统配置为使用SAP HANA Spark控制器连接到SAP HANA Studio中的远程数据源。SAP HANA Spark控制器使用的方法与通过配置单元,然后Spark,最后连接到HDFS的方法相同。

SAP HANA SPS10的新增功能播放列表中接下来的六个视频将介绍如何安装和配置SAP HANA Spark控制器,以便您可以基于SAP HANA和HDFS中的数据运行单个SQL语句系统。

有关SAP HANA SPS10新增功能的75多个教程视频,云快卖,请查看此SAP HANA Academy播放列表。

SAP HANA Academy–SAP HANA、Analytics和SAP HANA Cloud平台上的1200多个免费教程视频。

在Twitter@saphanaacademy上关注我们