域名注册_阿里云报价_新注册优惠

小七 2019年10月25日 21:23 141 0

自动超参数调整，缩放和跟踪：按需网络研讨会和常见问题解答现已提供！

在数据库里试试这个笔记本6月20日，我们的团队与Databricks软件工程师Joseph Bradley和Databricks的高级产品经理Yifan Cao共同主持了一场在线研讨会，研讨会内容包括：自动调整、缩放和跟踪Databricks。自动机器学习（AutoML）由于能够缩短数据科学团队的价值实现时间和最大限度地提高模型的预测性能，近年来受到了广泛的关注。然而，达到这种理想状态可能是一个复杂和资源密集的过程。在本次网络研讨会中，我们讨论了：Databricks上提供的AutoML产品的前景最流行的超参数调优技术以及实现这些技术的开源工具。我们在Databricks中为这些工具构建的改进，包括与MLflow的集成，特别是针对apachepyspark MLlib和Hyperopt。我们使用这些笔记本和教程演示了这些概念：笔记本：分布式Hyperopt+自动MLflow跟踪笔记本：MLlib+自动MLflow跟踪如果您想免费访问Databricks统一分析平台并尝试我们的笔记本电脑，您可以在这里免费试用。最后，我们进行了问答，下面是问答。Q：有没有云平台可以用于我们的实验？如果是这样，我们如何获得访问权限？Databricks AutoML特性在azuredatabricks和AWS中都可用。要开始，请按照我们的指示注册免费试用。Q：我们应该从超参数调整中获得多大的精度收益？执行超参数调整的准确性取决于模型、超参数和其他因素。您可以期望看到从初始超参数调整中获得的最大收益，随着您花费更多的时间进行调整，收益会逐渐减少。E、 g.在max_eval=50的情况下运行Hyperopt，其准确度的跳跃可能比将max_eval从50提高到100时的跳跃要大得多。Q： Hyperopt能否应用于scikit learn，TensorFlow？对。我们的分布式Hyperopt+MLflow特性适用于单节点机器学习训练代码，对底层ML库是不可知的。Hyperopt可以接受包含单机scikit learn、TensorFlow或其他ML代码的用户函数。注意，对于分布式机器学习培训，请考虑使用apachespark MLlib，它在Databricks的MLflow中自动跟踪。Q：什么是开源的？我们正在使用apachespark通过"SparkTrials"开发分布式Hyperopt，自动跟踪MLflow仍然是Databricks特有的特性。Q：你能详细说明什么是条件超参数调整吗？它对模型搜索有什么帮助？条件超参数整定是指对某些超参数的搜索依赖于其他超参数的值进行的调整，例如，对线性模型进行正则化调整时，对于L2正则化，可以搜索正则化参数"lambda"的一个范围，但是对于L1正则化，可以搜索不同范围的"lambda"，这种技术有助于模型搜索，因为不同的模型具有不同的超参数。例如，对于一个分类问题，您可以考虑在logistic回归或随机森林之间进行选择。在相同的Hyperopt搜索中，您可以测试两种算法，搜索与每个算法相关联的不同超参数，例如logistic回归的正则化和随机森林的树数。Q： MLflow是否会自动选择最佳模型并将其作为父管路，将其他管路作为子管路？我们的MLflow与MLlib和Hyperopt的集成会自动选择最佳的模型和结构，并与父子层次结构一起运行。要非常清楚，这个集成有两个部分，分别处理不同的方面：（a）MLflow只是用于日志记录和跟踪，而（b）MLlib和Hyperopt包含调整逻辑因此，MLlib和Hyperopt会比较模型，选择最佳模型，并决定如何在MLflow运行时跟踪模型。Q：我可以设置一个降低/改变的预定学习率作为超参数吗？是的，但是减慢速度的逻辑需要在您的自定义ML代码中。一些深度学习库支持收缩学习率：例如。，https://www.tensorflow.org/api_docs/python/tf/compat/v1/train/index_decay。Q：我们能在MLflow跟踪UI中看到所有用于模型的特性吗？默认情况下不会记录功能，但您可以添加自定义MLflow日志记录代码来记录功能名称。为此，我们建议在主运行下记录功能名称以进行调整。如果这些特性被记录为一长串名称，那么最好将它们记录为MLflow标记或工件，因为它们支持比Databricks中MLflow参数更大/更长的值。Q： MLflow是否能够处理自动化特征工程？您可以轻松地安装第三方库（如Featuretools）以自动进行功能工程，并将生成的特性记录到MLflow中Q： MLflow在进行迁移学习时有何帮助？迁移学习有很多种类型，因此很难给出一个单一的答案。本网络研讨会主题最相关的转移学习类型是使用从为一个模型调整超参数到为另一个模型进行热启动调整的结果。MLflow可以通过提供一个知识库来帮助了解过去的超参数和性能，帮助用户选择合理的超参数和范围以便将来搜索。将过去的结果应用到新的优化运行当前必须手动完成。Q：社区版中有这些功能吗？现在不行。Q： Scala中是否提供MLflow自动跟踪？现在不行。如果有足够的客户需求，我们会增加。其他资源：文档：超参数调整文档MLflow与H20.ai GPyOpt、HyperOpt集成博客：使用MLflow、Apache Spark MLlib和Hyperopt调整超参数视频：利用PySpark和Pandas udf实现Zynga预测建模自动化基于MLflow的深度学习高级超参数优化要开始使用MLflow，请按照中的说明操作mlflow.org网站或者查看Github上的发布代码。我们最近还为MLflow以及实时问题创建了一个Slack频道，您可以在Twitter上关注@MLflow。我们很高兴听到您对概念和代码的反馈！免费试用Databricks。今天就开始吧

本文地址： /zhuji/3239.html