_35企业邮箱登录_年度促销

小七 2019年10月25日 21:23 141 0

在Spark+AI 2019大会上，AI、机器学习和深度学习讲座指南

在很大程度上，麻省理工学院技术评论的karenhao撰写的这张信封背面的流程图，用图表阐明了人工智能在事物大计划中的作用。资料来源：https://www.technologyreview.com/s/612404/is-this-ai-we-draw-you-a-flowchart-to-work-it-out/虽然许多会议可能没有流程图来选择会话来确定什么是人工智能，但是，这些会议确实涉及到在其用例中构成AI的技术方面，无论是使用的机器学习还是深度学习技术。在2019年Spark+AI峰会上，我们看到了作为AI、产品化ML和深度学习技术轨道一部分的高水平技术会谈。在这个博客中，我们重点介绍了一些吸引我们眼球的谈话，因为它们蕴含着潜力的希望。它有助于导航（当然，不像上面的流程图那样详细）。人工智能用例所以让我们从几个人工智能用例开始，特别是在创造性艺术领域。生成性对抗网络（GANS）是由iangoodfellow等人提出的。在2014年的报纸上。从那时起，它的使用在生成数字图形方面采取了创造性的形式。J、罗森鲍姆的演讲《艺术的未来：用机器制造的令人毛骨悚然、轻浮而美丽的艺术》探讨了数字艺术的效果。在研究机器学习的用途以及它如何影响艺术的未来时，他问道，当艺术家和音乐家与机器合作时，艺术是什么样的，它的轻佻还是美丽？使用GANs对数字绘图进行了一次有趣的尝试。撇开创造性艺术不谈，人工智能已经在健康科学领域取得了进展。例如，阅读基于人工智能的应用程序，使用基于CNN的深度学习技术来识别医学图像中的对象并不少见。Fei Hu带我们进入他的旅程，在他的演讲中，他详细介绍了他如何使用基于CNN的两阶段模型来检测有丝分裂，并且具有高度的准确性：一种从大型医学图像中进行有丝分裂检测的分布式深度学习方法。与上述健康科学技术进步讨论密切相关的是使用apachespark的深入学习，从Bala Chandrasekaran的胸部X射线检查诊断胸部病理。他演示了如何使用apachespark和Analytics-Zoo构建一个基于AI的放射科医生系统，从胸部x射线图像中检测肺炎和其他疾病。在药物发现和设计方面，使用传统的基于机器学习的技术，合理的药物设计过程已经存在了几十年。然而，Peyvand Khademi涵盖了人工智能、深度学习和基于ML的技术的新应用增强了这一过程的一些主要领域。具体来说，他在演讲中谈到了各种与药物安全相关的人工智能和基于ML的技术：使用人工智能评估药物安全性。作为这些技术的一部分，他使用分级分类法来评估特定化合物的毒性。对于一个对人工智能在健康科学中的应用感兴趣的大数据从业者来说，这三个话题将会引起共鸣。分布式深度学习技术最近发布的apachespark2.4引入了一个调度器来支持barrier执行模式，以便更好地与基于MPI的程序集成，例如，TensorFlow和PyTorch等分布式深度学习框架。两节课详细讲述了使用Horovod进行分布式培训的不同策略和方案。Databricks的孟祥瑞详细介绍了氢项目，这是一个ApacheSpark计划，旨在将最先进的人工智能和大数据解决方案结合在一起。他关于氢项目的更新：在apachespark中统一最先进的人工智能和大数据的课程包括在Horovod和分布式TensorFlow上构建的分布式培训。同样，Jim Dowling在其"ROCm和Spark and TensorFlow分布式深度学习"课程中，也讨论了使用ROCm（Radeon开放生态系统）进行分布式培训的类似方法，其中包含了氢项目的各个方面。这两个讲座都将吸引那些希望使用TensorFlow或Pythorch进行分布式培训的机器学习工程师。生产性机器学习现在，训练深度学习或机器模型是机器学习模型开发生命周期中的一个阶段。另一个是这些模型的实验、部署和生产。接下来的几次会议将讨论这些阶段的一些挑战。考虑MLflow的超参数搜索、调节和跟踪实验。Databricks的Aaron Davidson在他的演讲中详细阐述了使用MLflow进行超参数调整的最佳实践。类似地，kevinkuo在他的演讲中补充和演示了如何使用MLflow实现从开发到部署的端到端生命周期：使用R和MLflow简化AI原型和部署。Clemens Mewald在他的演讲TensorFlow Extended:An end-to-end machine learning platform for TensorFlow中继续探讨了如何管理模型管理、版本控制和服务的端到端培训和生产。大规模协调管理数据和人工智能都是关于生产ML模型的规模，关于功能组之间的协调，关于管理支持ML代码的数据基础设施。作为一名数据科学家、数据工程师或ML工程师，四次谈话似乎符合你的要求。第一篇是来自Zendesk的郭伟志，标题恰如其分地称之为"更多的是更美好的——在Zendesk建立模型基础设施"。Kuo分享了与不同团队产品、数据科学和工程的密切合作是多么迫切，并讨论了他们的基础设施扩展如何促进每天50000个模型的构建和部署！其次，耐克首席工程师詹姆斯诺曼（jamesnorman）透露，数据科学家可以将他们的模型推向市场。通过减少与工程部协调的工作量和摩擦，Nike能够实现ML管道、作业调度、A/B测试和大规模服务的自动化。了解他们在这节课上是如何做到的。第三，Uber的Anne Holler和Michael Mui就米开朗基罗在一个生产培训和服务平台中使用Spark MLlib模型的谈话：经验和扩展支持培训、服务和生产数千个生产模型。它的大多数模型都是使用apachespark MLlib开发的。最后，GSI技术公司计算和数据科学的georgewilliams阐述了困扰许多生产服务器的幽灵和崩溃等漏洞。在他的演讲中，他阐述了如何使用ONXY机器学习开放文件格式大规模部署模型，以及如何使用Apache Spark大规模部署基于ML的网络威胁检测。深度学习班最后，如果您是TensorFlow或Keras的新手，并且想学习如何使用Horovod进行分布式培训，您可以参加一个培训课程：通过Keras、TensorFlow和Apache Spark进行深入学习。下一步是什么虽然你可以使用流程图快速评估什么是人工智能，但如果你是新来参加会议的话，最好还是带上这本指南。当然，你也可以仔细阅读并从日程中挑选课程。在下一篇博客中，我们将分享我们从与开发者、深度探索、结构化流媒体和连续应用程序相关的会议中挑选的内容。如果您还没有注册，请使用此代码JulesPicks并获得15%的折扣。再见！免费试用Databricks。今天就开始吧

本文地址： /zhuji/3160.html