2017年,第一个基于SAP Predictive Service的面向"机器学习"的内容在SAP Developer Center推出,提供了一系列专门的教程和一个全新的CodeJam主题,在12个地点发布。
在TechEd期间,我没想到在开发者车库的"机器学习"AppSpace轨道上会取得如此成功。
我得到的反馈是一致和简单的:我们想要更多!
因为每一个新年都会有新的决心、新的项目、新的内容、新的方式与开发者社区(来自SAP生态系统和其他领域)接触,所以我们决定2018年没有任何不同。所以,阿里大数据,让我们开始一些不同的事情!
目标是让你打开很多人认为是机器学习的"黑匣子",帮助你找出里面的东西。让我们看看我们是否能把这个"黑匣子"变成一个透明的、多功能的盒子,供您在将来使用。
另一个目的也是帮助您建立自己的机器学习"盒子",并运行您的实验和项目。
在我们开始安装产品和工具之前,下载数据并进行编码,我们需要设置场景并定义什么是机器学习。
在接下来的几周内,我们将讨论:
项目方法论
运行机器学习项目需要一种与其他项目一样的方法论。与其他项目一样,编码/建模只占整个项目工期和工作量的一小部分。
了解不同类型和算法族
了解有监督和无监督机器学习之间的区别以及相关的算法族(关联,分类、聚类、回归、时间序列)
行话和术语
使用机器学习的最大挑战之一是真正理解行话。当与拥有博士学位的非常聪明的人交谈时,他们倾向于使用一种非常晦涩的语言,他们只理解这种语言,因此我们将尝试澄清一些常见的术语和概念。
平台和环境
关于运行本系列和相关示例所需的平台的详细信息。这个环境将根据需要发展,例如在某个时候,我们将使用一些R脚本或TensorFlow,这将需要安装额外的软件。如果有一些请求,我们甚至可能在某个时候查看SAP Predictive Analytics。
扰流器警报:我们将使用SAP HANA,express edition。我知道我很幸运有一台64GB的内存机,但不是每个人都这样。但我将始终使用我将选择的示例和数据集来考虑这个约束。它将向您展示,运行SAP HANA express edition不需要太多,您仍然可以做一些很酷的事情并学习一些很酷的东西。
之后,我们将深入了解一些很酷的数据集,再看看SAP HANA库中现成的一些算法来解决这个用例:
SAP HANA Automated Predictive Library(APL)为利用SAP HANA平台资源的每个算法系列提供了一个强大的算法SAP HANA Predictive Analytics Library(PAL)为SAP HANA平台提供了90多个实施和优化的行业标准算法
我们不会仅局限于SAP HANA库,因为我们接下来将研究开源R集成以及TensorFlow的外部机器学习(EML)。
当然不是,企业应用开发,我真的很有创意!别开玩笑!
然后,数据分析怎么做,我们将开始研究使用模型的策略,并构建一些应用程序或扩展来演示如何利用我们的模型结果或功能。
但根据您的反馈,这可能会改变。
本系列不仅仅是让您熟悉术语,理解一些概念和理论,或者理解如何、为什么、何时何地使用机器学习。
我的意思是,云服务器,如果你能理解下面描述的所有行话,那将是很好的,但你的目标是通过示例和用例获得实践经验供你尝试。这也将是关于分享的!
在本系列中,我将推广现有的或新的教程,返利是什么,但也会参考一些现有的SAP内容,包括openSAP课程(不要害怕,不是所有的课程,只是特定的单元),还有外部有趣的内容。
我不希望每个人都精通所有内容。我假设你有一些关于统计学和数学的基本知识,以及一些基本的SQL或编程技能。
如果你觉得你缺少这些技能或想更深入一些,不用担心,只要问一下,有很多有价值的内容。
它已经开始了,这里是第一块:
theDavid Robinson DZone的《数据科学、机器学习和人工智能的区别》
关于数据科学、机器学习、深度学习和人工智能之间的区别还有很多困惑。本文试图描述主要区别:
机器学习、数据科学、人工智能、深度学习的区别,Vincent Granville关于数据科学中心的统计
另一篇伟大的文章,旨在描述数据科学家的类型。
很好的阅读!
我的目标是每周发布一篇新的内容,跟踪这一系列内容的最佳方式是:要么关注我:
–Twitter@adadouche
–SAP Community:Abdel DADOUCHE
无论如何,在发布一篇新文章之后,我还将更新上一篇文章,并提供下一篇文章的链接。因此,如果您在使用以下功能,您应该得到任何更新或评论的通知。
现在,我希望您能分享您的想法,贡献、参与他人与你的朋友和同事分享!!
(记住分享和给予反馈是关心!)
更新:这里是所有机器学习盒子每周博客的链接: