云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

京东云_虚拟主机美国_排行榜

小七 141 0

本教程介绍如何通过扩展预定义的基本运算符,在SAP Data Hub Pipeline Modeler中开发自定义管道运算符。

这是系列教程的第一篇文章:

SAP Data Hub–从基本运算符开发自定义管道运算符(第1部分)SAP数据中心—开发、运行、监控和跟踪数据管道(第2部分)SAP Data Hub–使用自己的Dockerfile开发自定义管道操作符(第3部分)

在开始本系列教程之前,请确保:

您熟悉SAP Data Hub的基本概念。更多信息,您可以参考SAP数据中心的SAP帮助门户(https://help.sap.com/viewer/p/sap\u DATA\u HUB).

您熟悉Docker的基本概念(https://docs.docker.com/get-started/)还有库伯内特斯(https://kubernetes.io/docs/concepts/overview/what-is-kubernetes/).

您可以访问SAP Data Hub Pipeline ModelerSAP Data Hub 1.2的一部分。如果您没有可用的SAP Data Hub安装,您也可以使用SAP Data Hub Developer Edition,它允许在您自己的桌面上免费测试数据管道方案。SAP Data Hub Developer Edition可从以下位置下载:https://developers.sap.com/tutorials/datahub-docker-v2-setup.htmlThorsten的博客文章解释了如何安装和使用SAP Data Hub Developer Edition:https://blogs.sap.com/2017/12/06/sap-data-hub-developer-edition/

Pipeline Modeler

SAP Data Hub Pipeline Modeler工具基于一个Pipeline引擎,该引擎使用基于流的编程范式来创建数据处理管道它们被建模为计算图,并在Kubernetes上运行的容器化环境中执行。

请注意,当前版本的SAP Data Hub Developer Edition在单个Docker映像/容器中运行和执行管道,因此不需要Kubernetes安装。

什么是管道(图)?

管道或图形是通过输入端口和输出端口相互连接的操作员网络,用于交换数据。管道(图形)和操作员存储在SAP Vora存储库中的文件夹结构中。通过选择resp,可以在sapdatahub Pipeline Modeler中访问存储库内容以及可用的管道(图)。导航窗格中的选项卡:

当您在导航窗格中单击特定管道(图形)时,该工具将打开管道编辑器,您可以在其中检查,修改并执行管道:

上面的例子显示了一个简单的管道,它生成了以二进制格式存储在HDFS(Hadoop分布式文件系统)中的随机数据。第二部分再次从HDFS读取相同的数据,并将内容打印到浏览器终端。

什么是操作符?

运算符表示图形的顶点,并对来自环境的事件作出反应。来自环境的事件是通过其输入端口传递给操作员的消息。操作员可以通过其输出端口与环境交互。下图显示了一个示例操作符以及输入端口和输出端口。每个端口都与一个端口类型相关联,工具使用颜色代码来标识兼容的端口类型:

操作员需要特定的运行时环境来执行。例如,如果一个操作符执行一些JavaScript代码,它需要一个带有JavaScript引擎的环境。SAP Data Hub Data Pipelines工具为操作员提供特定的预定义环境,美国高防云服务器,这些环境作为Docker文件库提供给用户。

当您执行管道(图形)时,该工具将图形中的每个操作员转换为进程。然后,它在Docker文件中搜索适合操作员执行的环境,并实例化Docker映像。Docker映像与环境和操作员进程在Kubernetes集群上执行。

预装运的操作员可以参数化,一些操作员可以提供自定义脚本,允许实现各种不同的场景,而无需进行较低级别的编程。

运算符可扩展性概念

在某些情况下,现有运算符不足以实现某个场景,或者定制的运算符应可在其他管道中重用。为了支持这样的用例,医疗物联网,sapdatahub管道工具为操作符提供了一个高级扩展性选项,它允许创建新的操作符,并将几乎所有代码包装到操作符中:

本教程解释了如何创建派生操作符(1),而不必定义自己的Docker文件。操作员自己的Docker文件的创建和使用将在本系列的下一个教程中解释。

作为一个例子,我们创建了一个天气传感器模拟器,它反复发送温度和湿度等测量值。操作员扩展了预先提供的JavaScript运算符,并与该运算符提供的环境保持良好的关系。

1。创建文件夹结构

第一步,我们为虚拟公司"acme"创建自己的文件夹结构,然后在该文件夹的子文件夹中创建weather sensor operator:

在web浏览器中启动SAP Data Hub Pipeline Modeler。

在左侧的导航窗格中,选择"存储库"选项卡:

该工具显示存储库中可用的所有图形、运算符和Docker文件。

右键单击"运算符"部分在存储库中创建一个文件夹,然后选择"创建文件夹"创建一个新文件夹,大数据分析学习,稍后在其中创建运算符:

为根文件夹提供名称"acme",网云服务器,并选择确定:

右键单击文件夹"acme",重复前面的步骤创建一个名为"generators"的子文件夹。

存储库中生成的文件夹结构现在应如下所示:

2。创建操作员

接下来,我们在文件夹中创建一个自定义操作员。

右键单击文件夹"generators"并选择"Create Operator"菜单选项:

在Name(名称)文本字段中,提供名称"weather(天气)传感器"。

在Display Name(显示名称)文本字段中,提供显示名称,e、 g."Weather Sensor"(搜索操作员时会考虑显示名称)

在基本操作员下拉列表中,选择"Javascript操作员":

选择"确定"。

该工具打开操作员编辑器窗口。操作员编辑器是基于表单的编辑器,您可以在其中定义操作员的详细信息。

3。定义操作员

操作员的定义包括JSON格式的元数据,包括ID和描述、输入端口和输出端口、操作员配置和Docker映像提供的所需执行环境。

我们的操作员生成数据,但不从输入中读取任何数据。因此,它不需要任何输入端口,

在输出端口部分,选择+并定义一个名为"Output"和类型为"string"的新输出端口: