云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

CDN_数据库哪个好_优惠券

小七 141 0

CDN_数据库哪个好_优惠券

这是一个关于企业机器学习在未来几年将向何处发展的博客。

我在SAP BI工作了近20年,断断续续地培训ML算法已经3年多了。事实上,大数据分析技术,3年前的12月假期,我开发了我的第一个机器学习应用程序(这是一个用于帮助台的路由自动化应用程序,使用深度学习来分类只基于他们的问题文本的调用——你可以从人们用来描述他们的问题的单词中学到很多东西。自从那时起,我已经创建了一些机器学习应用程序,主要使用SAP HANA数据库作为我的数据基础。但几乎所有的算法都是用Python手工制作的。这是一个技术过程,需要在许多领域的技能和企业级软件解决方案的经验。鉴于机器学习的力量,更多的人应该这样做。为什么不呢?或者一个信息量更大的问题是"为什么企业级机器学习要花这么长时间才能实现?"?"

我们都知道机器学习在个体问题层面解决了许多问题。例如,在检测图像中的一系列实体和发现疾病模式方面,计算机视觉现在比人类视觉更好。还有许多其他的机器学习应用于解决离散问题的例子,这些问题使用大数据集训练机器识别模式,并使用这些模式对看不见的例子进行预测。在过去的几年里,最先进的技术取得了如此巨大的进步,这真是令人惊讶。

在设计离散解决方案的同时,我问自己为什么没有更多的人这么做,我一直在努力找到在企业级利用机器学习的最佳方法。解决这个问题肯定会将机器学习的全部潜力释放到现代企业中的每个人身上,并以此实现智能企业的承诺。

似乎每个大型软件供应商都承诺以某种形式将机器学习注入到他们的解决方案中。但所有这些都是在离散层面上发生的。当然,如果我有情绪分析问题,我可以在sapdatahub中创建一个管道,并通过sapml基金会链接到TextBlob算法并分析情绪。但我受到SAP选择在机器学习基金会上主持的内容的限制。如果这些都不符合我的需要,我必须从头开始训练吗?

在企业环境中,从头开始手工制作算法并不是一个可扩展的解决方案。我们也不是都要成为机器学习工程师,这样每当我们需要一台新的机器自动化时,我们都能自己完成这项工作。

但是最近,当我对一台"智能"的猫扑进行最后的润色时,我使用了一种技术,实际上可能是解决企业ML问题的一种方法。这不是一种新的技术,但我怀疑它现在被忽视了,取而代之的是一种技术上纯粹的方法。

在我说太多之前,让我解释一下我面临的问题以及我是如何解决的。

我们家有一个问题,邻居家的猫(我们叫他西尔维斯特是为了保护他的隐私,他是暹罗人)闯入了我们家厨房通过我们的猫皮瓣和帮助自己的猫的食物。我们的猫(Lillie,碎布玩偶式品种)拒绝戴项圈,所以其中一个电子解锁解决方案不起作用,而且它们相当昂贵。

所以我想用一个小相机拍摄入口,并编码一个算法,当它认出Lillie靠近时释放活门,但不是为Sylvester。

我本可以简单地拍很多莉莉和西尔维斯特的照片,并训练我自己的算法,但那将需要时间和努力,而且西尔维斯特为了自己的安全,决定在这些天里,每当他看到我就逃跑,所以我只会有他的尾巴的照片!事实上,我用了一些诗意的许可证,因为我也可以设置一个相机,拍摄两只猫通过皮瓣,然后提取所有包含莉莉和所有包含西尔维斯特的帧,训练一个模型来发现差异,然后部署该模型,将任何新来的猫分类为莉莉或西尔维斯特。但这将占用我所有宝贵的假期时间。

结果证明,最有效的方法是采取一般工作,其他人在图像分类领域所做的工作,并修改它为我的具体应用。这是一种称为横向学习的技术,在数据科学领域得到了广泛的应用。然后我用碎布娃娃猫和暹罗猫(甚至连莉莉和西尔维斯特都没有)的一般图像重新训练最后一层。哦,顺便说一句,我能够使用Python脚本从Google自动下载图像,所以即使是这项任务也需要几分钟而不是几个小时。

我现在有了一个模型,它是由Google的力量训练出来的,但经过调整,可以解决我的Lillie/Sylvester问题。创建这个模型只花了几个小时。

这里的秘诀是转移学习技术,它允许我使用其他人的一般工作来完成繁重的工作,但随后调整模型以达到我的特定目的。

如果你推断出这种方法,并在企业规模上想象它,大数据分享,你很快就会明白它将是怎样的可以使用其他人训练的算法,并使用自己的特定数据对其进行微调。