云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

云数据库_263企业邮箱登录入口_企业级

小七 141 0

MLOps(来自机器学习和操作)是指管理机器学习模型的生产生命周期的过程,还包括数据科学家、数据工程师和IT专业人员之间的协作概念。目标是定义建议和最佳实践,以实现流程自动化、遵守法规要求以及提供对不断变化的业务需求作出反应的灵活性。尽管这一程序主要是技术性的,但没有有效实施MLOps实践的公司也面临着许多业务和财务挑战。

在这篇博客文章中,我想描述我们在几次客户服务中遇到的由于MLOps效率低下而产生的发现和挑战,并描述如何解决这些问题这些挑战可以通过SAP Data Intelligence解决,云服务器有哪些,希望能为其他类似情况下的人提供指导。

在开发机器学习模型并将其投入生产和利用提取的见解赚钱方面的主要挑战及其业务影响可以概括为以下几点:

it在数据科学团队中,在本地机器上开发并通过共享驱动器甚至电子邮件分发开发的模型是一种常见的做法。这会导致缺乏运营效率,并可能导致筒仓和协作障碍,从而延迟模型创建过程。这种延迟最终会导致错过财务机会,尤其是当所创建的模型依赖于时间并且很快过时时。例如,如果一个团队正在进行客户分析,以确定新产品报价的合适候选人,作为对竞争对手活动的反应,云教云,那么模型创建的延迟将导致客户没有及时参与,从而导致他们潜在地流失到竞争对手中。这是一个很好的例子,说明团队中的运营如何与财务损失直接相关。

一旦创建了分析模型,就需要在整个组织中轻松地使用/共享这些模型。模型可访问性中的一个瓶颈将导致分析洞察产生价值的延迟。这同样与各种业务和财务问题直接相关。

无法提供足够的模型部署、更新和管理环境会因过时的模型和最坏情况下的错误模型而给组织带来财务风险。除业务风险外,此类模型还可能损害公司形象和声誉。

无法及时监控模型性能和对关键警报采取行动可能导致重大财务损失。

用户和访问管理不足导致缺乏透明度和版本控制,这是关键特性特别是出于监管和审计目的。

尽管这一点与MLOP没有直接关系,但它与端到端的故事情节有关。从生产系统中提取业务数据并将其分发到整个组织会带来与隐私相关的风险,同时由于这些数据的敏感性和关键性,也会带来业务风险。

在下一节中,我将回顾如何使用SAP data Intelligence的标准功能来应对这些挑战。

图1:端到端机器学习过程的伪流程图

图1表示将机器学习模型引入生产并管理其生命周期的高级过程。SAP Data Intelligence目前为每一点提供现成的功能。网上有几篇文章更详细地描述了这些功能,例如SAP Data Intelligence博客系列或Nidhi的博客文章,因此,我将简要介绍标准功能及其与上述挑战的关系:

通过准备好的标准系统连接器,SAP Data Intelligence可以访问各种数据源,并在中心位置管理这些远程系统。(第1章:数据科学团队内部的协作,第6章:与业务数据有关的隐私问题)使用ML场景的概念,SAP Data Intelligence将属于一个虚拟容器场景的多个工件联合起来。该场景将ML实验数据、文档、实验运行、模型kpi和API部署保存在一个地方。跟踪工件的更改,并实现基于用户的访问。(CH1:数据科学团队内部的协作,CH2:跨组织的模型消耗,CH3:模型生命周期管理,CH5:访问限制和审核日志)scenario manager是SAP Data Intelligence中的一个应用程序,允许通过模板化管道自动化模型培训和模型部署,旨在实现从原型阶段(如Jupyter笔记本)到生产的无缝过渡。(CH2:跨组织的模型消耗)使用集成的数据湖,可以将模型存储到内部存储库中。(第3章:模型生命周期管理)在scenario manager中监视和报告哪些模型KPI具有灵活性。(CH4:性能监控)如果使用saphana作为数据源,则可以在数据库层应用模型,从而避免关键业务数据的不必要移动。hanasqlscript的Python接口称为HANA\u ml,允许直接用Python开发。(第1章:数据科学团队内部的协作,第6章:与业务数据有关的隐私问题)再培训以半自动的方式提供支持,将在下一节讨论。(第3章:模型生命周期管理)

从这个列表中可以看出,上述功能和挑战之间有很大的重叠。

SAP数据智能允许扩展其基本功能。在下一节中,我将讨论两个这样的扩展:如何实施自动再培训(图1中的第9点)和使用SAP Analytics Cloud创建性能监控仪表板。

通过SAP数据智能的管道化概念,可以将培训过程实施到管道中并触发此管道基于不同的规则或外部因素。以下是最常用的再培训方法:

图2:SAP Data Intelligence中基于计划的再培训是现成的