云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

企业邮箱_马云阿里巴巴是什么_价格

小七 141 0

各位读者好,

这是我上一篇博文的延续,https://blogs.sap.com/2020/11/30/how-to-deploy-a-natural-language-processing-model-with-tensorflow-on-sap-data-intelligence/,展示了如何使用TensorFlow和SAP Data Intelligence上的Deep Learning创建、培训和部署基本情绪分析以进行推理。这个博客在很大程度上是技术性的,因为它只展示了如何执行一个操作的说明,而没有展示任何可以从中派生的用例。在这篇非常简短的后续博客文章中,我将展示一些可以从这些模型中得出的见解。我最近对一个POC使用了情绪分析和方面术语提取,这涉及到在一系列笔记本评论中发现特定方面和与每个方面相关的情绪。请注意,本博客中包含笔记本电脑评论的数据集是一个非学术数据集,这意味着它不属于学术论文(如SemEval数据集)中发现的众多数据集之一,而且几乎都是2020年的数据集。基于方面的情绪分析(ABSA)是一个强大的工具,可以了解你的客户喜欢或不喜欢的产品和程度。我将使用SAP分析云软件系统来展示我的结果。首先,我将展示如何提取方面项的结果。结果展示了ABSA系统在一个数据集上的结果,该数据集由3500多个笔记本电脑评论组成。

我的模型培训的七个方面是:电池、热量、内存、端口、价格、质量和速度。我的ABSA系统已经确定,超过一半的评论是关于笔记本电脑的内存,即硬盘驱动器,碟驱动器和随机存取存储器(RAM)。从个人经验来看,这正是我过去买质量较低的笔记本电脑时所抱怨的。虽然价格和电池也占了很大一部分的评论,有极少数评论有关电池或质量的笔记本电脑正在购买。当然,了解你的客户在谈论什么是非常有用的,让我们看看他们是以积极还是消极的方式谈论它,以及在多大程度上。

正如你所看到的,大多数评论都是积极的,每个方面都收到了与他们所占比例相一致的积极和消极的部分前面的可视化中的方面。无论多么有用,这并没有充分利用ABSA系统的情绪分析部分,因此,我现在将展示极性的程度,大数据时代是什么意思,或者更确切地说,大数据啥意思,评价是多么积极。

使用TensorFlow培训的情绪分析模型,类似于我在本博客文章开头提到的上一篇文章中所展示的,我已经我们能够确定客户对各个方面所说的平均极性。在数据集中,最积极的方面似乎是电池,而另一方面则在.19到.21之间。然而,这只是整个数据集的平均值,如果能看到评论的极性如何随着时间的推移而变化,并与客户给他们的评分相关,那就更好了。这还可以展示客户的极性是否与他们给出的评论的评级相匹配。

由于我们的极性是一个0到1之间的情绪衡量标准,而客户给出的评论的评级在0到5之间,因此我决定对评级进行规范化,人工智能大数据,使其具有相同的规模和可比性。我还认为,查看某个特定方面的极性随时间的变化,云零售,而不是查看所有主题的平均极性,会很有用。

幸运的是,学生云服务器,由于SAP Analytics Cloud的轻松定制功能,我能够显示内存方面的极性随时间的变化。然后,供应商或电子商务网站就可以看到,由于软件或硬件的升级,在任何特定的时间点上是否会出现突然的下降或上升。这样做之后,对评论的平均极性似乎会下降到低于客户给他们的标准化评级。这意味着,平均而言,客户对评论的评价不如他们对评论的评价那么积极。这可能是由于多种原因造成的,例如客户可能只是对产品提出了一些批评,这是为了展示他们认为可以改进的案例,或者可能需要更改评级表,以便给客户提供更广泛的评级。尽管如此,这是一个数据科学家应该研究的数据或审查,看看为什么这是我的情况。现在,我将研究每个特定方面的词汇分布,看看是否有客户用来描述产品的关键词。我会选择查看负面评论的关键词,包括速度和记忆。

在这里,你可能会看到一个问题,在产品评论的自然文本中,客户使用相同或相似的词来描述产品。然而,这里的用处在于,在对速度的负面评价中,会出现关键词start,这可能暗示计算机在开机时启动,或者用户试图启动应用程序时启动。此外,负面内存评论显示,Windows和Support出现了问题,这可能表明Windows操作系统及其对其他应用程序的支持存在问题。然而,人们需要研究数据来找出确切的原因。虽然我已经这样做了,但为了保持这个博客的简短和简单,我将避免展示所有这些。我们现在已经看到了在SAP数据智能和SAP分析云可视化上使用NLP可以获得的一些见解。