云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

负载均衡_供应链cdn_促销

小七 141 0

Alluxio将编目和数据转换添加到其数据编排平台中

Alluxio公司是基于云的开源软件的开发人员,该软件将来自多个源的数据协调并统一为一种通用格式,今天宣布了一些新功能,可以简化转换和存储数据的任务。新功能还使数据科学家能够更快地获得数据,用于分析和机器学习应用程序。该公司的软件是一个内存虚拟存储层,与多个后端数据存储接口,将数据提供给依赖性能的开源计算框架,如apachespark、apachehbase和Presto。它的方法消除了副本,并使用智能缓存来预测来自框架的请求并相应地预加载数据。在过去的一年里,Alluxio已经进入了全球名称空间和数据管理领域,用于在商店之间移动数据。"Kubernetes为ComputeAlluxio所做的工作也为数据做了贡献,"首席执行官史蒂芬·米赫(Steven Mih)说,他指的是一种流行的平台,用于编排自包含的软件环境,称为容器。Alluxio正在解决从不同来源(如Amazon Web Services Inc.)的S3、Hadoop文件系统、Ceph免费软件存储平台和Dell Technologies Inc.的Dell EMC Elastic云存储转换和加载过程中固有的性能问题。它们都是由分析框架广泛支持的开放格式。该公司目前正在向其平台添加数据目录和转换服务。catalog服务管理系统中结构化数据的元数据,跟踪所有数据库、表和模式信息,以及所有存储数据的位置。这样就无需根据Apache配置单元数据仓库软件更改元存储区中的表位置,也无需重新启动或重新配置配置配置单元服务。catalog服务支持对任何类型的结构化数据进行模式感知优化。例如,一旦一个配置单元元存储被附加到Alluxio目录服务,该服务将自动挂载适当的表位置,并自动为表元数据提供Alluxio位置,该公司说。Mih说:"这样做的好处是Alluxio可以进行模式感知优化,以在特定模式下交付数据。"对于工程师来说,连接多个数据仓库更简单。他们需要元数据来了解他们拥有什么样的数据、数据有多大以及如何访问这些数据。"转换服务将数据转换为独立于源存储格式的计算优化表示。Alluxio表示,虽然结果取决于具体的格式和工作负载,但内部测试显示查询性能提高了五倍。"SQL框架以表、模式、行和列来考虑世界,而存储系统则考虑文件、对象、目录和原始字节,"Mih说他说:"我们可以将数据转换为计算优化,而不考虑其格式。"该服务将大量小文件合并为少量大文件,将逗号分隔的值格式转换为Parquet格式,并进行在线排序。该软件在Apache2.0许可证下的免费社区版和具有增强功能(如安全性和排序)的企业版中提供。该公司在其网站上发布有限的定价信息。图片:Unsplash既然你来了…点击订阅我们的YouTube频道(见下文),显示您对我们使命的支持。我们的订户越多,YouTube就越会向你推荐相关的企业和新兴技术内容。谢谢!支持我们的使命:>>>>>立即订阅我们的YouTube频道。……我们还想告诉你我们的使命,以及你如何帮助我们完成它。SiliconANGLE Media Inc.的商业模式是基于内容的内在价值,而不是广告。与许多在线出版物不同的是,我们没有付费墙或横幅广告,因为我们想让我们的新闻保持开放,不受影响,也不需要追逐交通。那个新闻、报道和评论SiliconANGLE——以及现场报道,我们的硅谷工作室和cube环球巡演的视频团队提供的未经剪辑的视频需要大量的辛勤工作、时间和金钱。保持高质量需要赞助商的支持,他们与我们的无广告新闻内容的愿景一致。如果你喜欢这里的报道,视频采访和其他无广告内容,请花点时间看看我们的赞助商支持的视频内容样本,在推特上表达你的支持,然后继续回到SiliconANGLE。