云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

域名备案_域名解析配置_企业级

小七 141 0

数据约简的四个不变定律

成本始终是部署和管理横向扩展NAS的一个因素。最近的卫生和经济事件使成本效益比以往任何时候都更加重要。数据缩减技术是一种简单而直接的降低成本的方法,但前提是要遵守特定的原则数据缩减声明NAS存储供应商向客户介绍的最超卖产品之一是绝对数据缩减率。数据缩减率为2:1…或3:1…或8:1的承诺和保证通常会引起寻求优化开支的IT管理员的注意。事实是,数据缩减效率高度依赖于工作负载。在测量之前,没有人知道生产工作负载的预期数据缩减率。减肥专家能在不了解你目前的饮食和锻炼习惯的情况下准确预测你的减肥情况吗?为什么这么重要数据缩减的想法是将尽可能多的数据压缩到物理存储中,这样就不必购买更多的物理存储。数据缩减是横向扩展NAS的一个常见功能,因为让我们面对这样一个问题:谁想购买比需要更多的磁盘或闪存? 最大的问题是如何最好地实现高效的数据缩减。用美国的说法,如果你能把10磅土豆挤进一个5磅重的袋子里,那就很有效了。从IT的角度讲,您的目标是将100TB的源数据压缩到50TB的目标磁盘,甚至是5到10TB的磁盘空间。这一点很重要,因为卓越的容量效率是不断给予的礼物,包括:减少物理存储成本更低的数据中心占地面积能耗更低根据支持合同管理和放置的存储设备更少四大定律从我们的观点来看,在企业非结构化数据环境中实现领先的容量效率和低成本有四个先决条件。让我们把它们称为"不变的定律",因为在不遵守这些定律的情况下,不可能在NAS产品的各种工作负载中实现最大程度的数据缩减法律1:重复数据消除这是删除重复文件数据并用指针表示删除的信息(无论是在文件级还是块级)。尽管通用重复数据消除技术在横向扩展NAS产品中相对常见,但并非所有重复数据消除技术都同样有效。例如,考虑两个10MB文件90%相同的情况。最高效的重复数据消除技术可以将这20 MB的数据总量减少到11 MB。文件级重复数据消除将保留每个文件的完整副本,因为它们不完全相同。两个10MB的文件以20MB的速度存储,因此不会节省空间。传统的块级重复数据消除技术将在一定范围内执行重复数据消除,具体取决于增量存在的位置。假设部分重复数据消除,这两个文件的平均空间可能为15MB(例如),节省25%的空间。这还不错,大多数NAS产品都能满足这一要求。最好的重复数据消除技术可以调整存储的块的大小(可变长度滑动窗口),这样两个文件所消耗的总存储空间可以达到11MB,最多可节省45%的空间和最大的效率。除非买家询问重复数据消除方法,否则他们可能不知道是否以最有效的方式对数据进行了重复数据消除。根据所使用的重复数据消除技术的不同,相同文件所消耗的总容量可能在11MB到20MB之间是的,了解数据的重复数据消除方式非常重要。法规2:跨卷重复数据消除在存储卷中高效地执行重复数据消除非常重要,但是对于分布在不同卷上的文件数据呢?您知道今天会发生这种情况,因为每个人都与同事或团队共享数据,从而导致环境中所有存储库中的副本都已修改。按卷进行重复数据消除无法重复删除位于不同存储卷中的相同文件数据。因此,数据缩减的第二定律指出,高效的重复数据消除不能局限于应用程序卷域。如果不这样做,驻留在三个不同数据中心卷上的三个10MB文件将消耗30MB。跨应用程序卷进行重复数据消除的能力在相同的情况下只会导致10MB的存储消耗。第三定律:数据压缩并非所有横向扩展NAS供应商都支持数据压缩,这可能会导致额外的数据缩减。虽然有些文件不容易压缩,但其他文件可以很容易地按2:1、3:1或更高的比例压缩。理论上,大多数通用的压缩算法应该提供相似的效率。然而,实际的实现可以在效率和性能之间进行权衡,因此使用相同压缩算法的两个供应商可以产生明显不同的缩减率。最好的实现使用既高效又高效的现代算法,从而避免了折衷。法律4:小文件优化由于传统NAS系统使用固定的块大小,主要由小文件组成的工作负载通常会导致存储放大。这导致了大量的空间浪费。例如,产品中使用8KB块的1KB文件意味着您在浪费7KB—7x放大!因此,100TB的小文件数据可以轻松地消耗200TB到1.5PB甚至更多,这一点也不奇怪。因此,数据缩减的第四定律指出,文件数据存储必须有效地与存储在其中的块相匹配。这意味着要么块大小必须变化以适应小文件的大小,要么多个小文件必须共享同一个存储块或blob,这样就不会浪费存储容量。与前三条法规一样,如果不询问供应商,买方可能不会意识到存储效率低下。超越法律除了这四个定律之外,在更广泛的数据管理环境中,还有其他因素可以对硬盘空间的消耗总量产生很大的影响。在现代系统文件和对象体系结构中,高效的体系结构是假定的。在这里草率行事可能会抵消法律规定的好处。现代高效的建筑应包括:外部NAS分层:无需通过第三方应用程序就可以透明地将较冷的数据从昂贵的第1层NAS存储分层到更经济高效的辅助NAS层。当内置到辅助NAS中时,网络客户端上的应用程序看不到任何区别。策略驱动的分层可以将数据移动到任一层。最终,每GB NAS数据的总体成本大大降低,同时为需要第1层存储或更新数据的应用程序释放了昂贵的第1层容量。高效的拷贝数据管理:这消除了创建额外拷贝对容量的影响。当拷贝用于各种目的(包括开发/测试)时,可写快照(或克隆)会对减少存储容量产生巨大影响。高效的复制和归档:当只发送更改的文件块时,从主站点到辅助站点的常规拷贝要高效得多。结果文件数据的存储效率更高,并且节省了网络带宽元数据和索引节点信息的现代键值存储:在传统系统中,只有几个字节的文件就可以占用几千字节的空间,有效地将文件扩展1000倍。现代产品利用更新的键值存储来高效地存储可变数量的元数据,而不是使用固定块。违法者怎么办?不遵循数据缩减的不变定律总是会导致惩罚。可用存储容量更少。由于磁盘和支持合同成本增加,磁盘费用增加。还有相关的数据中心占地面积和电力成本。最糟糕的是,我们常常会受到惩罚,直到我们与现代的多层数据缩减方法进行比较,我们才意识到这一点。我们倾向于认为所有的数据简化方法都是一样的,事实并非如此。coheresity SmartFiles的设计遵循四个不变的数据缩减法则,以及其他规则,以提供最佳的效率。它提供了高级重复数据消除、跨数据中心卷消除重复数据的能力、高级数据压缩以及消除小文件存储放大的惩罚。在SmartFiles网页、博客上了解更多信息,或阅读有关SmartFiles数据缩减的ESG分析报告。