云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

文件存储_经典老歌百度云_最新活动

小七 141 0

深度学习教程演示了如何使用deltalake和apachespark简化分布式深度学习模型推理™

10月10日,我们的团队与Databricks的软件工程师Meng Xiangrui Meng主持了一场简单分布式深度学习模型推理的在线研讨会。与模型训练不同的是,模型推理通常是令人尴尬的并行,因此很容易分发。然而,在实践中,复杂的数据场景和计算基础设施常常使得从数据源到接收器的"简单"任务很难完成。在本次网络研讨会中,我们使用apachespark和Delta-Lake的最新特性为分布式深度学习模型推理提供了一个端到端的参考管道。虽然参考管道适用于各种深度学习场景,但我们专注于图像应用程序,并演示了具体的难点和提出的解决方案。本演练从数据摄取和ETL开始,使用apachespark的二进制文件数据源将原始图像文件加载并存储到Delta-Lake表中。一个小的代码更改就可以使Spark structure流不断地发现和导入新的图像,使表保持最新。在Delta-Lake表中,Pandas UDF用于包装单节点代码并在Spark中执行分布式模型推理。我们使用这些简单的分布式深度学习模型推理笔记本和教程演示了这些概念。下面是一些额外的深入学习教程和可从Databricks获得的资源。深度学习文档深度学习基础系列分布式深度学习的简单步骤如果您想免费访问Databricks统一分析平台,并尝试我们的笔记本电脑,您可以访问免费试用。免费试用Databricks。今天就开始吧