云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

阿里云_硅云虚拟主机_三重好礼

小七 141 0

公告

2019年4月5日,淘客引流,HANA 2.0 SPS 04发布!在发布的一系列优秀功能中(更多详情请参见Joerg Latza的博客),我将重点介绍两个令人兴奋的功能—新的R和SAP HANA机器学习的增强版Python API。

要点

API现在从4月5日起随着HANA 2.0 SPS 04的发布而正式提供。您可以通过多种方式下载软件包,例如使用HANA Express下载管理器(请参阅本博客),并且可以直接免费开始!除了pythonapi之外,我们现在还有一个类似的R的API!在我以前的博客中,大数据是啥意思,我已经介绍了如何使用pythonapi,以及它为在海量数据集上构建机器学习模型所带来的价值,但下面您将看到一个增强功能的预览—探索性数据分析。通过添加rapi,您可以以类似的方式训练和部署模型。下面我提供了一些R API的代码示例,但要获得详细的概述,请参阅Kurt Holst的博客。机器学习过程的手动阶段(如特征工程、数据编码、采样、特征选择和交叉验证)现在可以由自动预测库(APL)算法来处理。用户只需要关注正在解决的业务问题。有关更多详细信息,请参阅文档,有关示例,请使用此链接。

Python示例–探索性数据分析

探索性数据分析(EDA)是数据科学的重要工具。它是使用统计技术和可视化来理解数据集的过程。您从EDA获得的洞察力可以帮助您发现问题和错误,对重要变量提供指导,从数据集中得出假设,并构建强大的预测模型。pythonapi现在包括3种EDA技术:

分布图饼图相关图

注:EDA功能将随着进一步的发布周期而扩展。

利用这些EDA图和HANA数据帧的好处最好用一些性能基准来说明。我在同一个1000万行数据集上测试了这些绘图,淘客帝国,并比较了返回到Jupyter绘图所需的时间使用HANA数据帧=小于5秒,对于3个绘图

以下示例使用泰坦尼克号数据集。数据来源于https://www.kaggle.com/c/titanic/data。

这只是EDA功能的预览,所有绘图和参数的深入概述将在我的下一个博客中详细介绍……请继续关注。

R示例–K表示聚类

SAP HANA中的K表示聚类是一种无监督的数据机器学习算法划分为一组k个簇或组。它将观察分为若干组,以便同一组中的物体尽可能相似。

对于这个例子,我将使用来自加州大学欧文分校的Iris数据集(https://archive.ics.uci.edu/ml/datasets/iris). 这个数据集包含植物虹膜的属性。有三种鸢尾植物。

连接到HANA

数据探索

训练K-均值聚类模型

这些片段并不意味着详尽的分析,只是为了展示API中的一些功能。要更多地了解使用HANA ML API的好处,大数据100,请参阅本博客,要更深入地了解R API,请再次参阅Kurt的博客。

摘要

R和Python无疑是数据科学家工具箱中最早的两个工具。HANA ML包现在支持两种编程语言,这有助于显著提高数据科学团队的生产力。无需再进行繁琐的数据传输,无需再等待数天的模型训练,利用HANA数据帧可以改变EDA和机器学习的游戏规则。当我们期望提高生产力时,我们自然而然地进入了自动化的世界。APL可以方便地访问自动化算法,以便在同一API中快速识别影响因素、验证假设和构建强大的预测模型。PAL和APL在HANA中共有100多个算法。API的内容将随着发布周期而更新。有关当前可用内容的信息,请遵循R API和Python API文档的链接。

附录

SAP HANA SPS04中的新增功能–https://blogs.sap.com/2019/04/05/whats-new-in-sap-hana-2.0-sps-04-2/从SAP HANA到R的机器学习-https://blogs.sap.com/2019/04/09/machine-learning-with-sap-hana-from-r/SAP HANA 2.0中用于机器学习的Python客户端API,淘客放单平台,速成版SPS 03,第33版-https://blogs.sap.com/2018/10/29/python-client-api-for-machine-learning-in-sap-hana-2.0-express-edition-sps-03-revision-33/什么是SAP HANA Automated Predictive Library–https://help.sap.com/viewer/cb31bd99d09747089754a0ba75067ed2/2.5.0.0/en-US端到端APL示例-https://help.sap.com/doc/0172e3957b5946da85d3fde85ee8f33d/2.0.03/en-US/html/hana#u ml.html#结束-使用自动预测库apl模块结束示例解释HANA ML软件包优点的博客–https://blogs.sap.com/2018/12/17/diving-into-the-hana-dataframe-python-integration-part-1/R API文件-https://help.sap.com/doc/c48739beb06a4304a98e44b4d5b60a50/2.0.04/en-US/hana.ml.r/html/00Index.htmlPython API文档-https://help.sap.com/doc/0172e3957b5946da85d3fde85ee8f33d/2.0.03/en-US/html/index.html了解SAP HANA数据帧-https://blogs.sap.com/2018/12/17/diving-into-the-hana-dataframe-python-integration-part-1/了解Python API中的ML功能-https://blogs.sap.com/2019/01/28/diving-into-the-hana-dataframe-python-integration-part-2/