云网站服务器_国内数据云存储_移动云数据库服务器主机-搜集站云

云主机_微网站建设开发_限时特惠

小七 141 0

如果你正在赶火车,这里是机器学习系列简介博客的链接,你可以从一开始就看到这个系列。在这个简介博客的结尾,你可以找到这个系列每个元素的链接。

在我们开始之前,快速回顾一下上周的时间

上一次,我们研究了如何利用SAP HANA R集成,它为大约11000个软件包打开了大门。所以,如果你觉得内置库(APL&PAL)不能提供你所需要的,或者你也想按自己的方式做事,现在你可以了!

我希望你们都能尝试一下,也许你们中的一些人已经开始比较PAL实现和R算法。随时分享您的反馈!

我知道我在上一次发布时(3周前)承诺过要深入研究TensorFlow集成。

但是由于我的NUC和我运行的一些虚拟机存在技术困难,什么是云计算和大数据,我不得不重建了几次(是的,如果你不按照说明操作,微信淘客,系统仍然会出问题),我决定推迟这篇文章,直到我能够理解为止找出一个在SUSE或Red Hat系统上设置TensorFlow服务模型服务器的简单方法,并提供一个有趣但简单的模型示例。

下周,我将尽我所能完成External Machine Learning(EML)library文章!

但本周的主题是Jupyter笔记本!

您可能会问为什么Abdel会谈论Jupyter笔记本,因为它不是SAP产品。原因很简单:它是与SAP产品一起使用的一个很好的工具。但同时也因为,如今在机器学习相关活动中使用Jupyter笔记本变得非常普遍。

这可能是与SAP HANA一起使用的完美工具,所有机器学习活动的速成版,因为它将允许您在那里做几乎所有您需要的事情:

运行SQL查询并在可视化中使用结果使用Python或R编写代码,并在使用SAP HANA实例中的数据时利用数千个可用包,如果Jupyter笔记本是一个开源的网络应用程序,允许你创建和共享包含实时代码、公式、可视化和叙述性文本的文档。

用途包括:数据清理和转换、数值模拟、统计建模、数据可视化、机器学习,更重要的是,

Jupyter项目是一个非盈利的开源项目,2014年诞生于IPython项目,内部优惠券,它支持所有编程语言的交互式数据科学和科学计算。

Jupyter是通过Jupyter社区的共识在GitHub上开发的。有关我们的管理方法的更多信息,请参阅我们的管理文档。

您可以在本地计算机或SAP HANA express edition服务器上安装Jupyter Notebook。

安装非常简单如果您选择本地安装,请参阅联机安装指南。

现在,如果您决定在SAP HANA express edition上安装Jupyter,您需要考虑我在教程中记录的一些事项。

例如,您需要生成一个配置文件并启用计算机IP地址而不是本地主机,除了设置SSL(可选)和密码(可选)。

使用带SAP HANA的Jupyter笔记本,速成版

请随意使用教程中的"提供反馈"链接,让我知道您对它的看法。

您可能已经意识到Jupyter最初是为运行Python脚本而设计的(实际上是使用一系列Python模块构建的)。

这意味着您可以使用SAP HANA Python驱动程序来连接和使用您的应用程序数据。但是需要您使用Python数据库API编写Python代码。

如果我可以告诉您,您可以使用Python数据库API构建一个运行SQL的Jupyter笔记本呢?

这就像魔术?事实上,这是ipythonsql的魔力。多亏了catherinedevlinworks,现在您可以用一个简单的%SQL作为SQL语句的前缀并获得结果了!

使用ipython sql magic意味着要使用SQLAlchemy,一个很棒的Python sql工具箱和对象关系映射器模块,以及SAP HANA的SQLAlchemy方言,大数据的商业价值,后者是Git上开源SAP存储库的一部分。

要开始使用它,在笔记本的第一个单元格中添加并调整以下代码:

然后您可以在所有SQL语句前面加上%SQL,如下所示:

如果您愿意,您可以操作返回结果集(API):

如果您想了解有关open source@SAP的更多信息,请务必关注我的同事Jonathan Baker或查看他的博客介绍open更多细节请咨询SAP。

当您进入"机器学习"领域时,您可能会认为您的日常工作将是在数据上运行算法。

但这与现实相去甚远。

正如您在机器学习的方框(第2周):项目方法学中所读到的,大部分工作都花在了(有时甚至浪费在)数据上数据准备

所以你将投入大量的时间分析数据并找到你需要记录的证据。我认为(根据构建大量文档和PowerPoint的经验),你必须使其尽可能具有交互性。

如果我们查看鸢尾花数据集,即使它"只是"4个数值属性来预测物种,你也可以使用不同的可视化来实现这一点,用你选择的语言。

假设你想绘制物种的频率基于4个属性中的每一个,这是您在Jupyter中使用Python内核编写的代码,例如使用matplotlib中的sklearn和pyplot:

但是您可以使用R内核:

执行完全相同的操作,云服务器品牌,这将输出如下内容:

或者在Python中使用散点图:

和在R中使用其他选项做什么我必须"演示和分享",但没有太多的编码?

那么我认为SAP Lumira就是你要找的。好消息是,您现在甚至有了一个专门的openSAP课程

开始使用SAP Lumira

结论

将Jupyter添加到我们的软件堆栈将真正帮助您实现数据科学的一些关键目标:代码、测试、,演示与分享

Jupyter绝对是我将在下一次参加或主持的hackathon中使用和推动的工具

这一次,下一个出版物将是关于TensorFlow的,我已经构建了内容

我只是缺少了一个关于图像处理的简单示例,Walldorf的一位同事好心地给我发了一个这样的示例我需要调查。

在这之后,我将暂停在出版物上,因为我期待在4月1日有一个新的家庭成员(不是玩笑)。

(记住分享和给予反馈是关心!)

更新:这里是所有机器学习盒子每周博客的链接: