文件存储_电信代理服务器_三重好礼

小七 2019年10月25日 21:23 141 0

数据库现在已普遍可用

今天，我们很高兴在Spark Summit 2015上宣布Databricks的全面可用性，Databricks是创建ApacheSpark团队的一个托管数据平台。使用Databricks，您可以毫不费力地启动Spark集群、交互式地浏览数据、运行生产作业以及连接第三方应用程序。我们相信数据链是使用大数据最简单的方法。我们在Databricks的愿景是使大数据变得简单，并使每个组织都能将其数据转化为价值。我们在2014年Spark峰会上首次发布了Databricks，并于11月限量推出。对于这个平台的兴奋是非常棒的，成千上万的人请求访问并从用户那里得到巨大的反馈。我们现在很高兴向这一愿景迈出下一步，让每个人都能使用数据库。我们希望为您的所有数据问题提供即时的生产效率。为什么是数据块？正如许多数据科学家和工程师所证实的，他们的大部分时间不是花在数据分析本身上，而是花在支持基础设施上，将不同的工具连接起来处理和可视化数据。同样有问题的是数据工程师需要重新实现数据科学家为生产开发的模型。有了数据块，数据科学家和工程师就可以消除这些问题，只需把时间花在数据上。瞬间火花团簇无需花费数周到数月的时间来配置硬件，而是立即在AmazonEC2上启动和管理优化的Spark集群。只需单击几下鼠标，就可以从几个节点扩展到数百个节点。您还可以使用amazonspot实例来节省成本。交互式地浏览和可视化您的数据Databricks包括笔记本电脑，一个用于探索和可视化的交互式协作多用户环境。您可以将文本、代码执行、可视化和高级分析（如机器学习（MLlib）和图形（GraphX））组合在同一个笔记本中。你可以用SQL、Python、Scala、Java和R来编写笔记本，这样Databricks就可以让你用你所选择的语言立即变得高效。轻松部署生产管线Databricks有一个强大的Jobs特性，可以将应用程序从原型应用到生产环境。通过Jobs，您可以同时运行笔记本电脑和独立的Spark或Spark流程序。作业包括灵活的调度程序、电子邮件警报、自动重试、运行历史记录和集群重用。此外，Databricks作业是第一个支持Spark流媒体的软件即服务平台，使得部署可伸缩、容错的流应用程序变得容易。Databricks作业是运行Spark应用程序的最简单方法。 GA的新功能随着今天发布的通用性，我们还将发布用户所要求的三个新功能。这些在Databricks部署中立即可用：spark1.4支持：在配置Databricks集群时选择apachespark1.4。笔记本电脑中的Spark流：在笔记本电脑中以交互方式试验Spark流，或将其部署到生产作业中。改进的评论：对笔记本中的单个文本选择进行评论，并通过新的侧边栏回复评论。接下来会发生什么？除了一般的可用性，在Spark峰会上，我们还宣布了几个主要的新功能，我们将在接下来的几个月内推出这些功能。预计不久将在您的Databricks部署中看到这些：R语言笔记本：使用R和SparkR分析数据，包括R的所有标准可视化和统计包。访问控制和私有笔记本：管理在单个级别上查看和执行代码的权限。版本控制和GitHub：跟踪Databricks中源代码的更改，并将笔记本电脑存储在GitHub中，以便在平台外使用它们。如何开始Databricks运行在您自己的Amazon Web服务帐户或虚拟私有云中。今天就报名参加为期14天的免费试用。有关数据块的更多信息，请访问：产品演示视频客户视频产品宣传册特色底漆数据表Spark和Databricks底漆卵子在雷达上：数据块Venturebeat文章：更多数据，更复杂？简化大数据免费试用Databricks。今天就开始吧

本文地址： /ziyuan/3669.html