华为云_mysql数据库操作命令_安全稳定

小七 2019年10月25日 21:23 141 0

2016年欧洲火花峰会第2天的数据广播

阅读欧洲火花峰会第一天的回顾。更新：演示视频现已发布。在下面找到它们。Spark峰会主题尽管10月的阴霾笼罩着布鲁塞尔，但在广场的会议中心内，与会者一手拿着咖啡，一手拿着糕点，排起了长队，聆听其他组织如何利用apachespark来完成他们的用例。用Apache Spark民主化人工智能第二天，Databricks首席执行官阿里·戈德西（AliGhodsi）就人工智能（AI）主题发表了主题演讲。阿里观察到机器学习算法本身很少是构建人工智能应用程序的主要障碍。相反，真正的罪魁祸首是管理基础设施和为ML算法准备数据的复杂系统。阿里认为，Spark是人工智能民主化的一个巨大飞跃，因为它的速度、灵活性和可扩展性。然而，Spark不能独自解决人工智能的所有问题，而这正是数据链的用武之地。Databricks的愿景是围绕Spark构建一个平台，使组织能够轻松地利用Spark固有的速度、灵活性和可伸缩性来进行高级分析和超越。作为向Databricks目标迈进的又一步，Ali宣布在Databricks的大数据平台上添加GPU支持和流行的深度学习库的集成。这使得组织可以在高度优化的GPU硬件上使用流行的TensorFlow框架轻松地对Spark进行深入学习。深度学习功能与Databricks平台的其他组件协同工作，使组织能够在端到端机器学习管道中无缝地执行数据争用、特征提取、交互式探索和模型培训。请阅读GPU支持上的博客以了解更多信息，或与我们联系以开始使用。开发人员跟踪会议TensorFrames:ApacheSpark上的TensorFlow深入学习Databricks工程师timhunter通过一个关于apachespark的深入学习的演讲，揭示了Ali主题演讲背后的更多细节。他讨论了如何将apachespark与TensorFlow结合起来，TensorFlow是一个来自Google的流行框架，为gpu上的机器学习计算提供了构建块。Tim演示了如何在apachespark上使用带有TensorFlow的gpu来获得极快的性能。正如亨特所解释的，窍门是张量框架。这是他编写的一个库，它允许Spark开发人员在Spark数据帧和TensorFlow运行时之间轻松传递数据，同时利用ProjectTungton中最新的性能优化。结果是更快更简单的代码。更新：您可以在这里观看完整的演示文稿。数据科学轨道结构化流媒体在线学习Databricks产品经理ramsriharsha在他的会话演讲中定义了在线机器学习，它是一种在一次操作中通过数据流有效地学习的能力，尤其是当您无法重放或重新访问数据点时。这种能力对两组问题很重要。首先，对于在给定时间内实现精度很重要的大规模学习，机器学习算法可能更快地达到该精度。第二，当数据分布随时间变化时，在线算法可以适应不断变化的算法。我们说，我们可以利用在线机器学习和机器学习来实现ML的在线容错功能。更新：您可以在这里观看完整的演示文稿。企业轨道沿着小溪划水在构建一个实时流媒体应用程序时，您如何解决升级版本、在语言之间迁移以及与外围系统集成的挑战？Databricks的系统工程师Miklos Christine今天讨论了他看到的客户遇到的5大问题以及他们是如何解决这些问题的。在前四期中，他展示了如何修复常见的stacktrace，例如类型不匹配、"找不到前导偏移量"错误、"toDF not member of RDD"和"task not serializable"在第五期中，Miklos介绍了如何有效地将JSON记录推送到Kinesis或Kafka。如果您一直在使用Spark Streaming，那么这个会话是学习如何避免开发人员可能遇到的常见陷阱的一个典型方法。更新：您可以在这里观看完整的演示文稿。下一步是什么此外，本次活动的幻灯片和录音将于11月4日前在Spark Summit网站上提供。免费试用Databricks。今天就开始吧

本文地址： /zhuji/3343.html