香港带宽_腾讯企业邮箱解析_免费6个月

小七 2019年10月25日 21:23 141 0

使用apachespark的结构化流进行大规模的流式ETL

在6月于旧金山举行的Spark峰会上，我们宣布ApacheSpark的结构化流媒体被标记为生产就绪和共享基准，以展示其与其他流媒体引擎相比的性能。结构化流媒体是一种新颖的流处理方式。这种新方法不仅使构建端到端流应用程序变得容易，而且还处理了容错的所有底层复杂性。作为开发人员，您不必担心它。在都柏林的Spark峰会上，我将介绍两个会谈，涉及结构化流媒体的许多方面。第一个讨论涉及概念、api、与外部源和接收器的集成、底层的增量sparksql执行引擎和容错语义，而第二个将重点讨论使用mapgroupswithstateapi的有状态流处理。在apachespark中使用结构化流处理简单、可伸缩、容错的流深入研究结构化流中的状态流处理你为什么要参加这些会议？如果您是一名数据工程师或数据科学家，希望通过流式传输增强ETL，用快速数据构建低延迟预测物联网或欺诈检测应用程序，并为数据摄取和实时流式分析创建流式管道，那么请参加我的会议。如果您还没有，请立即注册参加欧盟Spark峰会，并使用Databricks代码享受15%的折扣。再见，都柏林！免费试用Databricks。今天就开始吧

本文地址： /zhuji/3049.html