云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

负载均衡_华为云官网_免费

小七 141 0

总部位于以色列的初创企业瓦拉达(Varada)在一轮种子融资中获得750万美元,计划利用这轮融资让企业更容易获取大数据。该公司正在兜售一种大数据内联索引工具,该工具可以分析存储在基于云的数据湖中的信息,而无需先对其进行准备或建模。datalakes是一种存储存储库,在需要之前,它会以其本机格式保存大量的原始数据。当分层数据仓库将数据存储在文件或文件夹中时,数据湖使用平面架构来存储数据。湖中的每个数据元素都被分配一个唯一的标识符,并用一组扩展的元数据标记进行标记。当出现业务问题时,可以快速查询数据湖中的相关数据,然后可以分析较小的数据集来帮助回答问题。事实证明,数据湖在企业中很受欢迎,因为它们比传统数据库提供了更大的灵活性和更快的速度。通过允许信息保持其本机格式,可以使用更大、更及时的数据流进行分析。从理论上讲,数据湖似乎是存储数据以方便访问的最有效方式,因为它们消除了首先执行代价高昂且耗时的提取、转换和加载或ETL操作的需要。但数据湖仍然没有一些用户希望的那样高效,因为它们的结构意味着存储在其中的数据不再是针对特定分析需求而建模的,Varada联合创始人兼首席技术官David Krakov告诉siliconagle。"因此,数据湖的分析采用了‘暴力’的方法,扫描所有数据进行查询,"克拉科夫说例如,Amazon Web Services的Athena或EMR Presto等公司就采用了这种方法,成本高,性能低。"数据团队可以利用一些技巧来减少深入了解的时间,例如通过复制数据、对其进行分区、预聚合等等。但是数据量仍然要大得多,模式更复杂,而且数据源的数量之多意味着很难维护这些数据的各种副本之间的一致性和一致性。他说:"结果是,大多数数据湖都是由日期和地理位置等几个‘大维度’划分的单一副本。"分析仍然主要是暴力,需要定制和耗时的开发,以及针对特定任务的ETL流的昂贵维护。"克拉科夫说,瓦拉达对此提供了一种妥协。有了它,用户可以选择自己的高值数据集,并使用结构化查询语言命令来定义它们。然后,Varada将这个高价值数据集具体化,使其与数据湖保持同步,并实现更快的分析。克拉科夫说:"凭借我们的内联索引和分布式体系结构,我们可以在任何物化数据上提供比暴力分析快100倍的性能,我们使这种物化成为可以很容易地临时使用的东西。"。由Stare Ventures和Vareone领导的风险投资公司F2参与。照片:博瑞/皮克斯贝既然你来了…点击订阅我们的YouTube频道(见下文),显示您对我们使命的支持。我们的订户越多,YouTube就越会向你推荐相关的企业和新兴技术内容。谢谢!支持我们的使命:>>>>>立即订阅我们的YouTube频道。……我们还想告诉你我们的使命,以及你如何帮助我们完成它。SiliconANGLE Media Inc.的商业模式是基于内容的内在价值,而不是广告。与许多在线出版物不同的是,我们没有付费墙或横幅广告,因为我们想让我们的新闻保持开放,不受影响,也不需要追逐交通。那个新闻、报道和评论SiliconANGLE——以及现场报道,我们的硅谷工作室和cube环球巡演的视频团队提供的未经剪辑的视频需要大量的辛勤工作、时间和金钱。保持高质量需要赞助商的支持,他们与我们的无广告新闻内容的愿景一致。如果你喜欢这里的报道,视频采访和其他无广告内容,请花点时间看看我们的赞助商支持的视频内容样本,在推特上表达你的支持,然后继续回到SiliconANGLE。