大带宽_服务器阿里云_代金券

小七 2019年10月25日 21:23 141 0

Databricks与Simba合作提供Shark ODBC驱动程序

温哥华，不列颠哥伦比亚省。2014年4月30日—行业大数据连接专家Simba Technologies Inc.今天宣布，Databricks已授权Simba的ODBC驱动程序作为其基于标准的连接解决方案，Shark是下一代大数据处理引擎Apache Spark的SQL前端。由在加州大学伯克利分校（UC Berkeley）启动Spark研究项目（后来成为ApacheSpark）的团队创立，Databricks正在开发尖端系统，使企业能够更快、更深入地发现问题。Databricks首席执行官、加州大学伯克利分校计算机科学教授Ion Stoica说："我们相信，大数据是一个巨大的机会，在很大程度上还没有被开发，我们正致力于彻底改变组织可以用它做些什么。"作为这项任务的一部分，我们了解到BI工具将继续是消费数据和分析的关键媒介，我们很高兴宣布为BI工具用户提供企业级连接选项。Simba是企业大数据连接领域值得信赖的名字，在我们努力达到大数据分析和查询速度的新高度时，它是Databricks的明确合作伙伴选择。""在分布式数据方面，Shark是最前沿的，"Simba Technologies首席技术官George Chow指出其创新的分布式内存抽象使SQL查询大数据的速度比当前行业标准快100倍。将这一速度与Simba的Shark ODBC驱动程序相结合，将业界领先的BI工具（如Tableau和SAP Lumira）与Apache Hadoop发行版相结合，您将获得一个彻底改变大数据并实现难以置信的强大业务洞察力的企业解决方案。"Shark是一个开源的分布式SQL查询引擎，最初是在加州大学伯克利分校的AMPLab开发的，通过使用强大的Apache Spark引擎来加速计算，它提供了最先进的性能和高级分析。用户在内存中运行配置单元查询的速度可以提高100倍，在磁盘上运行速度可以提高10倍。Shark可以在现有仓库上运行未经修改的配置单元查询，与现有的配置单元数据、查询和udf完全兼容，并且可以直接从SQL调用复杂的分析函数，如机器学习。Shark支持中间查询容错，允许它扩展到非常大的作业，并作为解决SQL查询工作负载范围的单一工具。此外，Shark是使用Spark构建端到端数据工作流不可或缺的一部分，除了SQL之外，Spark还包括流数据、图形计算和机器学习功能。Simba Technologies基于标准的ODBC驱动程序为Alteryx、Cloudera、DataStax、Hortonworks、MapR和Microsoft等全球F2000领导者提供了商业智能（BI）、分析和基于配置单元的数据报告。Simba的驱动程序和供应商可用于个人、企业和OEM许可。有关Simba的大数据ODBC和JDBC驱动程序的更多信息以及30天的免费试用，请访问：。免费试用Databricks。今天就开始吧

本文地址： /ziyuan/3573.html