云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

_云服务器域名绑定_免费

小七 141 0

在Ingo Peter撰写的博客文章中,我们可以看到SAP Data Intelligence如何利用SAP HANA PAL通过使用Python操作符中的自定义代码来创建预测模型。在这篇文章中,我们将展示一种新的方式(从DI 1911开始提供),物联网智能家居,通过使用现成的运营商来使用PAL模型。

随着年终派对的临近,你的经理给你这个公司重要的数据科学家一个关键的工作:确保音乐播放列表尽可能有趣。这是非常重要的,让所有的员工都享受聚会。你在想:你到底要怎么做?毕竟,你不是DJ。所以,你决定将你的机器学习技能付诸实践,并创建一个模型来为你解决这个问题。但这带来了另一个问题:你将在哪里做?如果这个模型可以与您管理事件的内部软件集成,那就太好了。然后,您还记得在SAP博客文章中读到一个名为SAP Data Intelligence的平台,并决定使用它来解决这个问题。

与往常一样,您需要收集一些数据来训练模型。幸运的是,你在互联网上找到了一个数据集,其中包含了2019年Spotify前50首歌曲的列表以及与之相关的一些功能。将csv文件上传到AWS S3上的公司datalake。

打开Modeler应用程序创建管道,将csv中的数据加载到HANA DB中。另外,你还可以借此机会把它清理一下。由于您希望保持简单(至少目前如此),您决定只使用数据集上可用的一些功能。

这方面的管道也很简单。只需一个操作符读取文件,一个Python脚本预处理数据,最后一个HANA客户端操作符将数据插入数据库。看起来是这样的:

对于Read File操作符,配置非常简单:

对于Python操作符,右键单击并选择"Add group"将其包装为一个组。在该组的设置中,添加标签"pandas"。这将允许您导入pandas包,这使得处理csv文件更加容易。此外,您还可以在类型为"file"的运算符上创建一个输入端口message.file文件以及一个名为"数据"的"消息"类型的输出端口。Python代码如下:

然后配置SAP HANA客户端操作符,这也很简单:

最后,返利微信,连接操作符并运行管道。成功!数据现在在HANA中。你在这项努力中有了一个伟大的开端!

好吧,SAP Data Intelligence有一个应用程序。无需二次猜测,您打开ML Scenario Manager(MLSM),自助免费建站,并创建一个新场景:

在场景中,您单击Pipelines部分的+符号,选择模板HANA ML Training并为其命名。

创建后,您将进入Modeler UI。

在这里您将对管道进行一些配置。在本例中,您可以通过选择连接、指定训练和测试数据集、选择任务和算法以及通知键和目标列来配置HANA ML训练操作符。此外,还可以提供超参数来微调JSON格式的算法。它们可以在HANA ML文档页中找到,并且是特定于算法的。例如,这些是神经网络的超参数。

准备好后,配置如下:

就是这样!回到MLSM,选择该管道并单击execute。由于管道发生了更改,MLSM要求您创建一个新版本:

之后,您再次执行管道。这一次,MLSM将引导您完成一些步骤,您可以在这些步骤中提供当前执行的描述并提供全局管道配置。在本例中,将要创建的工件(模型)的名称。你给它一个名字,物联网技术及应用,然后点击保存。

然后,培训开始:

…过一会儿,你就有了一个闪亮的新模型。杰出的!

再次在MLSM中,您创建了一个新的管道,但这次您选择了HANA ML推断模板。

与之前一样,您将被带到建模器:

这次您将配置HANA ML推断操作符以连接到HANA系统。没错,任何HANA系统!不一定是训练模型的那个。配置如下:

返回MLSM,您选择管道并部署它:

再次,您创建了一个新版本,因为您修改了管道。

向导将引导您指定要使用的模型。在这里,您选择最近训练的模型并继续。

最后,您会得到一个URL,您可以使用它作为展示您的模型的REST端点。

是时候看看这个东西可以做什么了!为了简化问题,你可以通过提供一首歌的特征来做一个常规的卷曲,你想确定人们是否会喜欢:

这首歌的回答是:

太棒了!就是这样!你做到了!现在,数据分析与大数据,你只要让你的老板知道你的工作已经完成了,享受派对,得到应得的晋升就行了!