云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

华为云_全球高考百度云_价格

小七 141 0

华为云_全球高考百度云_价格

思想是活生生的、会呼吸的野兽,它们像一场中国人的耳语游戏一样,平销返利,在推特上快速传播,变成了再推特、博客、文章,最终进入我们这些人的心灵。在当今世界,它很快就成为了公认的"常态"。这基本上就是围绕着大数据这个话题所发生的事情。现在我们需要接受的第一个事实是,大数据不是一个新问题,当然不是,自从我们发明数字系统以来,大数据就一直存在。5000年前在苏美尔,云端服务器,计算巴比伦政府在你的算盘上的总支出将是一个相当具有挑战性的问题——这是一个大数据问题。要了解在更现代的大数据讨论中,我建议大家浏览一下福布斯的文章@GilPres的"大数据的一段非常短的历史"http://onforb.es/1fRelUN

我对这个话题感兴趣的是3V的出现(卷,速度和多样性(Velocity and Variety)成为公认的标准,这是2001年行业分析师道格•拉尼(Doug\u Laney)的一次大讨论,开始真正定义和分类大数据的挑战。在这之后,许多对3V的扩展开始占据主导地位,增加了可变性、准确性和复杂性等维度。大数据V中有许多定义,所有这些都给出了类似的观点,我从我们的老朋友维基百科上摘录了以下非常基本的内容():

体积–生成的数据量…是数据的大小决定了数据的价值和潜力…

多样性–大数据所属的类别…

速度–数据生成的速度数据…

可变性–…这是指数据有时可能表现出的不一致性…

准确性–所捕获数据的质量…

复杂性–数据管理可能会成为一个非常复杂的过程,尤其是当大量数据来自多个来源时。这些数据需要链接、连接和关联……

当我看到这些定义时,我不禁觉得我们遗漏了一些东西,这就是数据的浩瀚。数据量似乎只关注记录的数量和数据的指数增长——一些福音传道者谈论摩尔定律对大数据的影响。

粗略地说摩尔定律说,每两年,计算机容量就会翻倍,容量就是速度,记忆等。

多样性往往被用来解释不同类型的数据源,结构化、非结构化和社会性是正常的例子,并且随着数据性质的变化而变化,但考虑到记录中关联数据的增加,从何而来?这就是我所说的

关于浩瀚的意思。这对我们中许多人来说并不奇怪,他们多年来一直在浩瀚中探索复杂的问题,但当我们把注意力集中在聚会上更受欢迎的人身上时,似乎已经迷失在噪音中了,即数量和多样性。

让我们举一个简单的例子,数据分析平台,说明客户的购买倾向和个人目标营销。我们都已经掌握了这些技巧,有什么免费的云服务器,公司试图解释我们的购买行为,向我们发送针对我们的喜好和不喜欢的特定报价。谢天谢地,我比如说,当我真的厌倦了被提供10美分的咖啡时,作为一个传统的英国小伙子,我只喝过茶。这是有道理的,我们应用一些启发性的建议,否则我们会贬低我们的品牌,疏远我们的客户。我明白了!

为了支持这些有针对性的服务,我们的记录系统捕获了越来越多的信息——在我们的CRM系统中捕获客户的基本信息已经不够了,我们现在要考虑他们是否有猫,大数据调研报告,以及他们是否使用信用卡购买外卖食品。这就引出了一个问题关于浩瀚,这与传统的"基于行"的方式有关,而与"基于列"的方式有关。要对此进行真正详细准确的分析,我们需要考虑数据的广度和列数(千列),数以万计甚至数十万个列来识别客户。

所以,当我们思考大数据的时候,我们也不要忘记了解数据的浩瀚,并考虑我们如何处理数据带来的复杂性,以便能够提取真正的价值。随着市场继续关注大数据的流行方面,我们不要忘记,能够处理浩瀚的数据可能是真正的价值在这个竞争激烈的世界中,我们的业务与众不同。