云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

云主机_流数据库_排行榜

小七 141 0

云主机_流数据库_排行榜

在之前的一篇文章中,我写过为训练有素的用户设计高效的ui。好吧,这仅仅是故事的一半,返利商城系统开发,甚至更少:当用户还在学习曲线上的时候呢?用户需要立即提高效率的自助服务应用程序呢?请注意,是慢用户推动了投资回报率。如果您想提高应用程序的效率,您需要精确地追踪丢失的秒数。生存分析在这方面有很大的帮助——发现关键的应用程序,产生关于可能出错的想法,并激励和评估解决问题的活动。

几年前我遇到了生存分析,当时我需要统计技术来分析可用性测试的时间数据。在平均数、标准差和方差分析的环境下长大,这是一次让我大开眼界的经历。多棒的工具箱啊!

生存分析由保险数学家开发,他们希望探索影响客户预期寿命的因素。把"预期寿命"和"任务时间"交换,把"客户"和"用户"交换,你就会明白我为什么这么兴奋了。事实上,数学是一样的,云快卖,尽管对非专家来说确实有些可怕。让我们看看我是否能给你一个可读的介绍。

考虑图1,它显示了一个可用性研究中18个用户的任务完成时间。条形图表示每个用户处理任务的时间。我已经按时间对这些条进行了排序,因此对于任何给定的时间,您都可以看到有多少用户完成了任务。我还添加了一条对数趋势线,它很好地拟合了数据——不是偶然的,我们将看到这一点。

图1:可用性研究中18个用户的任务完成时间。

生存分析人员对某个人(用户)在给定时间点"生存"(继续工作)的可能性感兴趣。它可以计算为仍然"活着"的个体数除以研究中的个体数,称为生存函数S(t)。在我们的任务完成时间的例子中,它的补码F=(1-S)表示解决任务的可能性。只有18名受试者,我们的经验观察生存功能相当紧张。我们最终想要的是一个平滑函数,它能在整个用户群体中最优地估计生存函数。一旦我们有了它,我们就可以预测在给定的时间内有多少用户能够解决一项任务,而且我们还将看到更多的问题。

为了达到目标,我们需要采取两个步骤。首先,我们需要承认,用户排名指数并不是对该人在整个人口中的百分比排名的精确估计——它是一个用于计数的数字,云信息,但不是相应百分比区间的中点。幸运的是,有一个简单的公式可以解决这个问题,称为中位数秩估计:

S=1−(i−0.3)/(N+0.4)

其中i是秩指数,秒单客返利机器人,物联网技术与应用,N是研究参与者的数量。

第二步有点棘手。我们需要确定和近似一个函数,该函数对对应于S(或F)值的时间数据进行最佳建模。这取决于数据遵循的统计分布类型,而这又取决于最初生成这些时间数据的基本过程。有相当多的候选分布,但有一个突出:指数分布。

指数分布是典型的纯随机过程,如放射性衰变。这些过程的特点是,受影响项目的比例随着时间的推移是恒定的。你可能听过"半衰期"这个词:如果一种物质的一半原子在时间t衰变,那么这一半的原子在2t之后就会衰变。这就是为什么图1中的对数曲线拟合得这么好!

这大大简化了我们的函数逼近问题:如果我们在对数标度上绘制S,我们可以简单地拟合一条直线!所以让我们再次绘制图1中的时间,但是这次,与s的自然对数相对(它变为负,因为s假设值在0和1之间)。添加一条趋势线,再加上回归方程和R²,需要在Excel中单击两次,所以我们也要这样做。为了完成这张图片,我加了两行,分别是S=0,5(一半的用户完成了任务;橙色)和S=0,25(F=75%完成;灰色)。

图2:图1中数据的概率图。

结果称为概率图。让我们看看我们看到了什么。首先,数据点实际上是直线排列的。线性趋势线(蓝色)方程解释了96,21%的观察方差;这就是R²的含义——这表明指数分布模型拟合得相当好。其次,考虑橙色和灰色线与趋势线的交点。这些点的纵坐标表示50%响应的时间。75%的用户完成了任务。当我们对S值1、0.5和0.25的x(时间)的回归方程进行解析时,我们分别得到51.4s、127.5s和203.7s。让我们将这些时间称为t0、t50和t75,根据当时解决任务的用户百分比(t50也称为中间时间)。

现在是有趣的部分。如果你计算时间差t50–t0和t75–t50,你会得到76.2秒,这正是指数分布的"半衰期"。下一半的用户将再次使用这76.2秒完成!试着自己计算一下12.5%和6.25%的用户仍然忙碌的时间。事实上,您可以计算任何时候您可以期望完成任务的用户百分比!