云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

网站空间_效果好的网站建设公司_优惠

小七 141 0

我想和大家分享一下我和我的同事为我们的一位客户开发的产品的一些经验和见解。在这个项目中,我们利用了一系列成熟的指数级技术来提供最先进的解决方案。

由于竞争激烈,零售店提供的个人帮助正在迅速减少,特别是来自在线商店,这导致了员工的减少。同时,产品种类和布局变化的步伐加快,使得员工很难保持更新。该项目的目标是将基于语音的自然语言交互的易用性与逼真的虚拟形象结合起来,以及有关库存水平和位置、消费趋势、以及,国内云服务器哪家好,季节性和假日变化等,以提供最具个性和合格的客户体验。

我们的解决方案由多个组件组成,这些组件由一个定制中间件协调。我们采用混合匹配的方法,利用多家供应商提供的现成服务,以构建一个功能强大的解决方案。

可视前端由一个逼真的数字化身(来自Quantum Capture的CTRL Human平台)组成,该化身在零售环境的大屏幕上显示。监视器的位置使得化身大致与真人大小,并且与客户处于眼睛水平。客户可以通过与虚拟形象交谈或按下触摸屏上的屏幕按钮与虚拟形象互动。

大多数数字虚拟形象产品都采用按键通话模式,用户在与虚拟形象交谈时必须按住按钮。我们的测试很快发现,在我们的场景中,这是良好用户体验的一个主要障碍,部分原因是这会迫使用户不舒服地站在大显示器附近,部分原因是用户的期望已经超出了按键通话似乎直观的程度。因此,我们开发了一个定制组件,它将麦克风的输入与摄像头的输入结合起来,以自动检测用户何时与化身通话。这使得客户与化身的交互更加自然和直观。

在后端,hadoop大数据,我们的解决方案利用不同的云服务来提供必要的功能和信息。

许多不同的云服务,其中许多都是CTRL Human固有的,可以将用户的语音转换为文本。我们目前支持ibmwatson语音到文本、amazonweb服务的转录和Google云文本到语音。他们都提供了良好的语音识别时,加上高品质的麦克风和软件技术,以避免来自环境的背景噪音。其他供应商提供类似的服务,具有类似的性能水平。服务之间的主要区别似乎是支持语言的数量和提供的定制程度。

后端的核心是自然语言处理(NLP),它解释用户的输入并返回指导对话的意图。我们的解决方案使用SAP会话AI(CAI),物联网管理平台,但也支持其他NLP服务。为了提供有关产品、可用性、位置等的详细信息,我们在适当的情况下,在自定义中间件中使用SAP ERP系统的数据来增加NLP的输出。为了减轻SAP ERP系统的处理负担,并且因为它为用户提供了额外的功能,例如简单的屏幕过滤和搜索优化,我们使用Qlik应用程序作为ERP数据的中介。

最后,文语转换服务用于将NLP的会话响应呈现给用户。亚马逊、IBM、谷歌和其他公司都提供良好的文本到语音服务,提供不同的选项和定制程度。

该项目的主要目标之一是尽量使用户和化身之间的交互简单、直观,最终尽可能自然。虽然我们的产品在这方面做得相当好,但我们已经确定了一些需要改进的地方。这里有一些例子。

NLP可以进一步完善,数据无价,以提高回应的质量以及可能的互动的广度。然而,国家大数据,以目前的技术,必须在两者之间取得平衡。如果一个人试图使NLP的范围非常广泛,当主题领域开始重叠时,这可能会以提供的回答的准确性为代价。尽管这项技术近年来取得了长足的进步,但创造一个良好的会话人工智能仍然是一门艺术,也是一门科学,需要不断完善。

提供完全自然的会话交互的另一个障碍是用户的输入和化身的反应之间的滞后。在我们的系统中,这个延迟是由1)语音到文本、2)NLP、3)ERP数据处理、4)文本到语音以及5)每个延迟所引起的延迟的总和。随着时间的推移,网络和服务性能的总体改进将减少其中一些,而我们可以通过服务局部性在解决方案体系结构中改进其中一些。然而,除了能够在零售环境中的单个设备上本地部署所有组件之外,这种系统可能总是存在一些滞后。