云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

数据库服务器_中间件运维_稳定性好

小七 141 0

MLflow 0.2发布

在今年的Spark+AI峰会上,我们介绍了MLflow,一个简化机器学习生命周期的开源平台。在发布后的3周内,我们已经看到了数据科学家和工程师对使用和贡献MLflow的极大兴趣。MLFlow的GitHub存储库已经有180个fork,超过12个贡献者提交了问题和请求。此外,上周有将近100人来参加我们的第一次传销会议。今天,我们很高兴地宣布mlflowv0.2,它是我们几天前发布的,其中包含了一些来自内部客户机和开源用户最需要的特性。如果您按照MLflow快速入门指南中的说明pip安装MLflow,那么MLflow 0.2已经可用。在这篇文章中,我们将介绍这个版本中的主要新特性。内置TensorFlow集成MLflow使得训练和服务任何机器学习库中的模型变得很容易,只要您可以将它们包装在Python函数中,但是对于非常常用的库,我们希望提供内置的支持。在这个版本中,我们添加了mlflow.tensorflow公司包,这使得将张量流模型记录到MLflow跟踪中很容易。以这种方式记录模型后,可以立即将其传递给MLflow已经支持的所有部署工具(例如本地REST服务器、azureml服务或apachespark进行批处理推断)。下面的示例展示了用户如何记录经过训练的TF模型,并使用内置功能使用pyfunc抽象进行部署。训练环境:保存训练过的TF模型#以SavedModel格式保存估计器。estimator_path=您的_回归器.export_savedmodel(型号_-dir,接收器_-fn)#使用MLflow记录导出的SavedModel。#signature_def_key:要计算的签名定义的名称#当SavedModel加载回进行推断时#参考号:(https://www.tensorflow.org/serving/signature_defs).#工件路径:路径(当前运行的工件目录下)到#模型将保存为工件。mlflow.tensorflow.log_保存的_模型(saved_model_dir=估计器路径,signature_def_key="预测",工件_path="model")部署环境:负载节省的TF模型和预测估计器路径=。。。#保存TF的位置#我们可以将TensorFlow估计器作为Python函数加载。#您可以使用一个本地文件或传递一个运行ID来加载上一次运行中的工件。pyfunc=mlflow.tensorflow.load_pyfunc(估计器路径)#我们现在可以在Pandas数据帧上应用这个模型来进行预测。预测_df=pyfunc.预测测向(df)生产跟踪服务器在mlflow0.2中,我们添加了一个新的MLflow服务器命令,该命令启动MLflow跟踪服务器的生产版本,用于跟踪和查询实验运行。与本地mlflow ui命令不同,mlflow服务器可以支持多个工作线程和S3支持的存储,如下所述。您可以通读MLflow文档,了解如何运行跟踪服务器。S3支持的工件存储MLflow的一个关键特性是记录训练运行的输出,其中可以包括称为"artifacts"的任意文件。在mlflow0.2中,我们通过MLflow server命令的--artifact root参数添加了对在S3中存储工件的支持。这使得在多个云实例上运行MLflow培训作业和跟踪结果变得非常容易。下面的示例演示如何使用S3工件存储启动跟踪服务器。在EC2实例上运行MLflow服务器:%主机名美国西南部ec2-222-442-4。compute.amazonaws.com网站%mlflow服务器\--文件存储/mnt/persistent disk/mlflow\u data\--工件根s3://my mlflow bucket/MLflow客户端:mlflow.set_跟踪_uri("http://ec2-11-222-333-444.us-west-2.compute.amazonaws.com")...与mlflow.start_运行():mlflow.log_参数("x",1)mlflow.log_度量("y",2)...mlflow.log_工件("/tmp/model")其他改进除了这些更大的特性之外,这个版本还包括一些bug和文档修复。更改的完整列表可以在变更日志中找到。我们欢迎更多关于mlflow-users@googlegroups.com或者在GitHub上提交问题或提交补丁。对于有关MLflow的实时问题,我们最近还为MLflow创建了一个Slack通道。MLflow的下一步是什么?我们计划在MLflow处于alpha时继续快速更新。例如,我们正在进行的工作包括与更多库(如PyTorch、Keras和MLlib)的内置集成,以及对跟踪服务器可用性的进一步改进。对于我们下一步工作的概述,请查看上周会议上的演示文稿中的路线图幻灯片或观看会议演示。对于希望尝试MLflow托管版本的Databricks用户,我们也接受注册databricks.com/mlflow.信用MLflow 0.2包括Aaron Davidson、Andrew Chen、Andy Konwinski、David Matthews、Denny Lee、Jianxin Shan、Joel Akeret、Jules Damji、Juntai Zheng、Justin Olsson、Mani Parkhe、Manuel Garrido、Matei Zaharia、Michelangelo D'Agostino、Ndjido Ardo Bar、彭宇、Siddharth Murching、Stephanie Bodoff、Tingfan Wu、Tomas Nykodym和Xue Yu提供的补丁免费试用Databricks。今天就开始吧