微软云_企业邮箱登_好用

小七 2019年10月25日 21:23 141 0

背景

"我的服务票什么时候完成？"

人们越来越认识到，在当今竞争激烈的市场中，高质量的客户服务是关键。公司正在寻求满足客户需求和提高满意度的方法。当客户通过服务单寻求帮助时，他们期望得到快速、透明和有效的响应。在交易的另一边，一个服务代理团队正在处理大量不同的机票。代理商的目标是在解决客户分配的问题时，与客户进行愉快的互动。然而，在现实中，一些看似简单又常被问到的问题，比如："这要花多长时间？"？"通常很难回答。想象一下，一位客户要求估算一下修复位于南美的风力涡轮机需要多长时间。代理可以花费相当多的时间和精力来找出正确的响应。如果我们可以向服务代理提供估计的完成时间，作为服务票证的一组扩展"预测"属性的一部分，会怎么样？

我们提出了一个预测模型，利用历史记录的隐藏结构和机器学习算法来估计完成一张票的时间。预测模型提供了基于单个客户数据集的定制解决方案。使用客户数据对模型进行训练后，在创建时将其应用于新的票据。因此，服务代理可以利用估计的时间来完成客户交互的早期阶段。

数据收集和特征工程

令人惊讶的是，零售大数据解决方案，在企业领域建立预测模型时，数据收集和特征工程是最难完成的步骤。从GDPR约束，到对变量交互作用的理解，再到模型变量分布中不可预见的变化，理解客户服务背后的基本流程是预测模型成功的关键。

我们提出了一个估计完成一张机票所需时间的模型。此预测在创建票证时提供，当时可用的数据有限。我们可以访问以下数据：谁创建了票证，谁最初被指派处理票证，票证的类别，票证创建的时间，大数据的培训，以及其他变量。

谁在处理票证-在将票证分配给正确的团队方面，一些服务代理比其他人更有经验。它有助于减少团队之间的票证转换时间。

创建票证时，对于使用非连续计划的服务组织来说，创建时间可能是一个关键变量。例如，如果票证是在午餐时间创建的，或者票证是在周五下午创建的，并且必须等到下周一才能处理，则可以添加额外的分钟数。如果服务人员减少，节假日也会影响响应时间。

机票类别-具体的机票类别可能更复杂，需要更多时间来解决。关于公司政策信息的票证请求可以有一个直接且简短的解决方案。但是，为处理机器维修而打开的工单可能需要数周时间。

工单优先级和升级–优先级和/或升级级别越高，为工单提供的关注和资源就越多。这可能意味着更快的解决方案，但事实上，票据已被放入升级或设置为高优先级可能意味着更复杂，因此解决时间更长。

建模

机器学习算法一般分为：监督学习，无监督学习，半监督学习和强化学习。前两类可能是最广为人知和使用最广泛的。

监督学习的模型基于历史数据的例子，其中因变量（通常是一个）用多个自变量来解释。因变量，或通常称为目标变量，可以由离散值或连续值组成。离散目标变量的一个例子是票证是否是垃圾邮件。连续目标变量的一个例子是住房价格。有监督学习侧重于解释目标变量，而无监督学习侧重于描述数据的整体结构和模式。

我们的完成时间模型源自有监督学习算法。虽然目标变量——完成一张罚单的时间——是一个连续变量，但我们用离散形式的变量进行了实验，医疗物联网，并发现了有趣的结果。为目标变量的连续版本导出回归模型。多类分类模型是针对一个代表完成时间范围的离散目标变量而建立的。

集成方法将统一是力量的原则应用于机器学习算法。集成算法的思想是在几个较弱的学习者的基础上产生一个较强的学习者。我们的多类分类方法使用集成方法的原理。具体来说，我们使用了一种boosting技术，其中每个执行的基于树的模型将定义下一个模型将关注的特性。

模型选择和预测结果

问题是：如果我们有多个竞争选项，如何选择一个模型？通常使用模型质量度量，如准确性、精确性、召回率、ROC、F1分数等来评估模型性能。例如，准确度表示我们得到正确预测的分数。从纯模型质量的角度来看，这些度量被视为关键指标。然而，对客户来说，"什么是正确的"可能与他们的期望有关。模型的可解释性和预测值的消耗同样重要。

在这个用例中（票到完成的时间），重要的是预测的"时间间隔"而不是确切的持续时间。从用户的角度来看，提供一个时间框架估计比一个精确的数字更符合他们的期望。假设一个服务代理在电话中试图回答一个关于机票有效期的问题，一般来说，客户会对这样的回答感到满意，例如"这可能需要3-5天"。没有附加值，事实上，说"您的票估计在3天13小时内完成"可能会很尴尬。

本文地址： /ziyuan/67583.html