云数据库_服务器和云_优惠

小七 2019年10月25日 21:23 141 0

好数据_一切都在交付中

伟大的数据是关于人的，而不是数字。它是关于推动明智的决策和激励队友的正确行为。伟大的数据不仅关乎数据本身，也关乎交付——因为在大数据时代，获取数据很容易…。让一切都有意义是一个完全不同的挑战。在我们最近关于数据基础设施的博客文章中，我们很高兴与大家分享我们在Asana学习到的利用数据进行商业智能的一些事情：我们用来提供可操作见解的工具和策略，我们构建游乐场而不是SQL查询的方式，我们甚至会分享一些最有用的视觉效果。每一个组织都在战略和执行上展开竞争——做出正确的选择，并成功地付诸行动。数据告诉了这两个部分，最终，获胜的团队用大量的数据做到了这一点。以下是我们在体式中收集、探索和传递商业智能的方法。第一步：大量收集（和连接）在我们开始分析之前，我们需要数据来处理，并且它需要与我们手头的问题或目标相关。我们力求在我们需要之前收集尽可能多的数据。我们的大部分数据与产品使用和状态有关，但我们也从第三方系统中引入数据。重要的是，所有这些数据都放在一个地方——我们的集中统计数据库（Redshift）。不管是来自我们的生产数据库、事件日志、错误日志、计费系统、营销自动化系统还是CRM的数据……我们都知道这些数据必须放在一起才能有意义。第一方拥有的数据只是实现真正商业智能的唯一途径——如果我们不能将来自不同来源的数据连接起来，我们就无法回答以下问题：我们的营销活动是否提供优质用户？需要将广告属性数据加入到参与数据中我们的客户成功计划是否成功地推动了收入增长？需要加入列表（可能在我们的CRM中）以及参与度和计费数据我们最重要的客户是不是遇到了一个严重的错误，我们需要伸出援手？需要将错误/错误日志合并到客户数据中我们的内部系统显示了Twitter广告的采用和升级。如果不将归属数据与我们在一个中央数据库中的参与数据绑定，这是不可能的。数据团队常常忘记，除了产品中设置的日志系统之外，还有一个关于用户的完整上下文。收集大量的数据需要连接大量的系统并将数据带入室内。这是一项艰巨的工作，但绝对需要高智商。步骤2：启用探索一旦我们把我们需要的所有数据都放在一个地方，就应该开始弄清楚这一切意味着什么。我们发现了一个经常出现的有问题的组织模式——数据消费者需要洞察，他们要求一个"仪表盘"。我们花了大量的时间构建它，然后我们立刻忘记了它的存在——它没有用，因为我们不知道我们真正想要什么。这种模式中缺少的部分是探索——让数据消费者接触到可用的内容，让他们发现真正的驱动程序，并允许他们使用尽可能多的向量和数据点"玩"。勘探阶段的目标很简单：把数据交给有领域知识的人降低自助数据的技术门槛使用一个灵活的工具，使协作、可视化和共享见解变得容易，这样团队就可以找到合适的度量标准来团结一致我们用于数据探索的主要工具是Looker，一个连接到统计数据库的BI工具。BI工具的另一种选择是由一组分析师对我们团队可以提出的所有问题进行一次性查询，这是无限数量的问题。对于提问者和分析师来说，这是一个缓慢、令人精疲力尽、缺乏动力的过程，而且它最终无法扩展：不同的团队最终会看到来自不同系统和流程的不同数字，组织智能也会受到影响。Looker允许数据使用者直接浏览数据仓库，并将其查询转换为特定于方言的SQL。它与Redshift配合得非常好，而且是100%的云传输Looker是一个很棒的BI工具，它允许我们围绕数据构建一个"模型"，集中定义、共享视图和添加元数据。我们可以专注于构建模型，而不是整天编写查询。构建一个游乐场比编写SQL有趣得多。第三步：以出色的交付力推动决策一旦我们了解了我们想要跟踪的指标，我们就可以构建报告——通常是以仪表板的形式。我们在这方面的目标是推动伟大的商业决策——在我们的销售渠道中发现机会，跟踪我们的营销活动以提高成本效益，并分解增长，以便我们能够了解不同的组成部分和杠杆。根据我们的经验，这一部分必须是定制的——没有任何第三方工具能够满足我们在呈现和交付数据方面的具体要求。例如，我们对平滑处理和向最重要的仪表板添加事件注释有特定的要求。我们对我们跟踪的核心聚合指标进行了大量的思考，包括平滑、显著性区间和添加元数据（如发布）。我们使用定制的Python和Highcharts来生成这些报告。我们已经确定了两种主要的仪表板类型-聚合和参数化。每天晚上预先生成聚合仪表盘；它们主要跟踪主要指标和趋势。使用特定对象或类别的模板动态生成参数化报告。我们建立了一个内部应用程序，在那里我们可以搜索客户、建立在体式上的应用程序、营销活动，甚至是城市——并立即生成一个仪表盘。我们也有一个工具来查看实验的结果——参数化报告的另一个例子。"海洋图"是我们客户报告的一个关键部分，它显示了一段时间内某个领域的总体增长和参与深度。我们使用Sinatra、大量的SQL和Highcharts在一个内部工具中生成它。对于需要每天甚至每小时跟踪的关键数据，我们使用推送机制，如电子邮件或体位。每天，我们的市场营销团队都会获得最新的漏斗指标，如注册、邀请和推荐来源，以保持团队专注于收购和推动结果的因素。当主要客户遇到潜在升级或客户流失的触发因素时，我们的客户成功团队将得到分配给他们的Asana任务-这不仅提醒他们，而且分配了责任，以便我们能够确保有人采取行动。我们在Asana的每日注册电子邮件已经成为公司最受关注的报告之一。在我们努力实现更好的商业智能的过程中，只要注意到聚合/参数化和推/拉报告之间的差异，并根据当前的需要选择正确的交付机制，这一点非常重要。我们在交付方面学到的其他重要经验教训马克吐温说："谎言有三种：谎言、该死的谎言和统计数字。"在体式中，我们试图确保我们的统计数据不是谎言，但我们也要注意数据对心理和决策的影响。在我们的旅程中，我们学到了（并重新学习）了一些关于交付良好数据的经验教训：明智地选择指标。选择团队可以移动的指标。避免虚荣心。你应该有理由在每一份报告中包含每个数字或图表。围绕几个核心指标集合。更多的数据并不等于更多的智能，通常情况恰恰相反。懒惰的数据团队认为，公开所有的数据可以实现完美的智能。更可能的是，它会导致混乱和分析瘫痪。记住你的听众。您的成长团队可能会发现抽样、标准偏差和统计显著性方面的巨大价值，而您的财务团队可能需要精确性。构建尊重每个团队或消费者需求的报告，同时保持定义和数据源的一致性。可发现性是交付的关键部分。对于每个数据项目，问"我们能重用这个分析吗？"还有"我怎么才能让它被发现？"将我们所有的主要报告放在一个中心门户中，对于让我们的团队团结在指标周围并对在哪里寻找见解充满信心至关重要。搜索是实现参数化报表可发现性的一个非常重要的部分，这就是我们在系统中查找客户的方法。领域知识是无法替代的。我们在Asana使用矩阵结构，数据分析师被嵌入到他们服务的团队中，这样当营销部门提出要求时，做出回应的数据人员真正理解问题、背景和请求的优先级。底线根据蜘蛛侠和伏尔泰的说法，"权力越大责任越大"。数据人员站在信息和行动的交汇处，他们可以对组织的结果产生巨大的影响。数据科学家应该开始像社会科学家那样思考，并意识到我们如何传递数据会影响理解和决策。通过对第一方拥有的数据仓库的大量收集，一个灵活的平台，数据消费者可以在其中探索和磨练洞察力，以及对一组核心指标进行深思熟虑的报告，伟大的商业智能可以推动伟大的商业决策和支持增长。它所需要的就是出色的交付。感谢过去和现在的Asana数据人员：Jack、Alex、Rachel、Spradlin、Marco、Kris、Graham和RJ，感谢他们的指导、代码评审和不断学习新事物。

本文地址： /ziyuan/15699.html