云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

数据库服务器_jojo的奇妙冒险3百度云_怎么买

小七 141 0

这是数学,不是魔法:建立机器学习团队的四个教训

Mixpanel首席执行官为产品领导者提供的机器学习见解从首席执行官到产品经理再到风险投资家,每个人都想更好地理解机器学习。他们知道这有可能使他们的软件更上一层楼。他们感到周围的兴奋。他们读过TechCrunch或《财富》的文章,甚至可能做了一两个快速的线性回归。但在机器学习方面,许多产品领导者要解决的首要问题是,他们需要的程序不仅能处理数字,还可以为数字思考。他们会说,"我想让算法告诉我原因。为什么我的客户没有转变?为什么这个功能没有我希望的那么好?我要因果关系!"事情是这样的。机器学习的目标不是证明因果关系,而是对特定的指标、行为或模式做出高质量的预测。这个算法的唯一任务是让你更高效、更准确地达到目标,而不是告诉你原因。从表面上看,这似乎有点令人失望,但如果加以适当利用,它实际上是一种解脱。机器学习正在创造下一个层次的数据分析进化。今天由机器学习奠定的基础是帮助工程师构建更好和更复杂的软件。此外,聪明的公司正在摆脱不计成本增长的理念,接受可预测性的承诺。事实证明,可预测性是机器学习的保证。但是机器学习对于一个工程师来说并不容易;它不像在你已经了解Ruby的情况下学习Python。我们的工程师,包括我自己,甚至两年前都不知道机器学习。我知道,如果我们要使用机器学习来构建产品分析,我们必须接受我们不知道什么是我们不知道的,并且理解我们正在处理的是复杂的数学,而不是魔法。 我们最大的挑战和经验教训关于机器学习,我最感兴趣的是它能让软件做更自动化的事情,这在以前仅仅通过直接编程是不可能的。作为一名工程师,这是令人兴奋的。但是作为一个产品领导者,机器学习给我带来了一些我以前从未遇到过的新挑战。我没有试图成为一名机器学习专家,而是聘请了詹妮·芬克尔博士(一位真正的机器学习专家)来组建一个团队,能够成功地应对机器学习的挑战,从而将Mixpanel提升到一个新的水平。我为我们在过去两年里所做的一切感到骄傲,更为我们在建立Mixpanel的机器学习团队的过程中所学到的东西感到骄傲。以下是一些最重要的教训:1你需要专家。我很快意识到我们需要真正的机器学习专家来构建真正的机器学习产品。高比例的顶级机器学习博士进入谷歌或微软。为了弥补这一点,人们给公司配备了统计员。这使他们接近一个真正的机器学习团队,但机器学习所需的复杂数学水平无法与数学统计学家的类型相媲美。我支持真正的机器学习专家,这是我再次做出的决定。2很难知道从哪里开始。虽然您可能希望立即构建疯狂、复杂的算法,但要开始应用机器学习,您需要对数据采取许多基本步骤。您可能一开始就没有数据,可能没有准备好建模的干净数据,也可能没有模型。所以,这并不像"开始把机器学习应用到我们正在做的事情上"那么简单,这是工程师精疲力竭的秘诀。三。规模总是成为一个问题。规模对机器学习成功与否的影响要比单纯的统计数据所面临的影响大得多。工程师们知道,与纯统计相关的数据量并没有那么重要。这就是为什么,例如,我们可以随机抽取电子商务客户的样本,并获得一个相当准确的模型,说明所有客户将如何响应在线促销活动–我们不需要知道所有购买的产品组合或每种可能的结果来了解可能的结果。然而,若您想进行机器学习,数据量的重要性更大。你对每一个可能的结果了解得越多,你的预测能力就越强。仅仅对一些过去的事件或实时行为进行抽样是不够的;您的模型需要知道某件事情的每一个案例,并集中在正确的解决方案上,以赋予可预测性优势。为了继续电子商务的例子,假设一家电子商务公司希望超越预测谁会对促销做出反应,并了解更复杂的采购模式。机器学习必须学习电子商务公司的200万客户中的每一个人如何找到他们购买的产品,在他们购买的每一个可能的组合路径,以建立最准确的模型如何购买模式。这样,随着数据粒度的巨大增加,未来的购买模式可以更准确地预测。考虑从这么多数据中获取如此高的细节是有点疯狂的,这就是为什么你需要一个真正的机器学习工程师团队,他们能够快速运行并构建出最好的模型。4记住,目标是可预测性,而不是因果关系。企业一直希望能够做一些事情,比如预测当季的销售情况,看看通过促销活动他们将获得多少客户,或者知道什么时候需求会出现波动。机器学习可以极大地促进模式识别,它同时自动化和驱动可预测性。这就是为什么我知道我必须在这个领域进行认真的投资。当然,这些课程都不会让你气馁。毕竟,对于产品团队来说,机器学习的"原因"很简单:机器学习可以比人类更快、更准确地找出是什么让人粘在一起,然后自动采取行动。如果你能建立一个良性循环的用户反馈和更好的用户体验,那么也许你可以让更多的人使用你的产品。从那里,你可以建立这样一个数据网络效应:获得更多的用户,得到更多的数据,得到更好的模型,得到更多的用户,等等。作为一个产品领导者,你的工作就是制造出优秀的产品并把它们带给你的观众。从产品开发的角度来看,机器学习是最令人兴奋的,因为它可以自动消除分析中的许多其他任务和担忧(即异常检测)。因此,如果您认真考虑实施机器学习,那么您应该认真思考您要解决的问题。在你建立一个机器学习团队之前,你必须知道你是否有与你的雄心壮志相匹配的基础设施。意识到自己可能不是一个失败,也不是你短视的证明;只是机器学习是最前沿的,每个人都在寻找如何在获得好处的同时最好地整合其能力。"建设vs.购买"是一个错误的二分法归根结底是这样的:计算机真的非常擅长记忆大量的数据,然后能够在所记忆的所有数据中找到模式和趋势。人类在这两方面都很糟糕。如果你想改变公司的竞争力,你必须通过解决复杂问题的优秀模型来推动洞察力。现在唯一的方法就是通过机器学习,有一个高技能的团队,他们可以找出模式是什么样子的。如果你是一家规模较小的公司,那么你的工程师可以在他们的笔记本电脑上制作模型,这可能足以让你开始。但是如果你有大量的数据,一个自举的解决方案不能从机器学习中得到你所需要的,也不能让你保持竞争力。最重要的是权衡。建立一个机器学习模型需要很长时间。你的工程师花在非核心能力上的每一分钟都不是花在你的核心产品和与众不同之处上的一分钟。此外,大多数机器学习都涉及大规模的迭代,因为您需要收集、标记和重复处理大量数据。如果你必须自己处理这个规模,这是一个额外的负担,你的工程团队,和数万美元。你必须决定内部构建什么,不应该构建什么。我们正在Mixpanel努力工作,让机器学习以正确的方式进行产品分析,而不仅仅是"时髦"的方式。对于我们来说,预测和智能警报都只是一个开始,因为即使您刚刚开始跟踪分析,我们也希望帮助您专注于构建正确的产品,而不是一直关注您的数字当机器学习做得好的时候,它会非常强大。机器学习可以生成精确的预测模型,这些模型可以实现非常令人兴奋的事情,比如创建高度定制的用户体验,对照片中的数千个对象进行分类,并生成大量突破性的行业特定结果,而无需编程。机器学习的机会在于,你可以建立全新的文明,而不仅仅是一座可以看到空城的摩天大楼。照片来自xdxd_vs_xdxd、chrstphre campbell和Sagie,并在Creative Commons Attribution 2.0通用许可下提供。