云网站服务器_国内数据云存储_移动云数据库服务器主机-搜集站云

微软云_使徒行者1百度云_免费1年

小七 141 0

在这篇博文中,您将了解如何使用SAP HANA和SAP Analytics Cloud的技术创建一个以社交网络为主题的端到端场景。如果没有SAP咨询公司的David Probst、Daniel Gerdes、Fabian Filsinger和Lukas Brueggemann的技术专长和创造力,这个项目就不可能实现。因为顾问让世界变得更美好?

简介

此概念验证的目的是在Twitter和SAP HANA数据平台之间建立连接,返利app下载,然后在SAP Analytics Cloud中可视化结果。SAP-HANA用于直接提取通用数据,计算各种关键数据,并通过使用可用的情感分析功能自动评估数据。最后,SAP Analytics Cloud以清晰易懂的方式呈现了此分析的结果。下面描述的方法允许我们在SAP HANA中运行情绪分析,并在SAP Analytics Cloud中近实时地显示结果。下图显示了自动搜索(1)、处理(2)、分析(3)和准备自动显示数据(4)的概念:

情绪分析的第一步称为数据提取,需要Twitter通过数据供应代理(DP代理)连接到SAP HANA。此后,SAP HANA的请求将通过DP代理发送到Twitter搜索API。它的答案到达SAP-HANA,在SAP-HANA中,数据被相应地准备好,并以表格的形式组织起来,只表示相关的信息。情感分析自动启动预处理和后续特征提取。知识提取的最后一步是创建一个计算视图,将以前创建的不同表或视图连接在一起。这个新界面是SAP HANA的一个计算视图,包含所有关键指标,可以通过直接的实时连接在SAP Analytics Cloud中可视化。

如何获取Twitter数据

SAP HANA可以用于在Twitter数据上搜索特定关键字并从中扣除情感。一般来说,Twitter提供了几个允许自动数据访问的接口。但是,只有搜索API作为Twitter的搜索功能的接口才具有所需的功能范围,因此我们建议使用它。搜索API的使用方式与本地Twitter搜索函数类似,请求的结果包含许多Twitter指标。这里有几个有用的开始:

收藏计数•转发次数•等语言代码•国家•用户ID•身份证•tweet

"最爱计数"反映了一条tweet收到的赞数。"转发次数"代表一条微博的转发次数。由于这两个值都对积极或消极的tweet给予了更大的重视,因此在情绪得分的计算中,这两个值是必不可少的。度量标准"isolanguagecode"包含tweet的语言,符合Twitter已经分类的ISO-3166-1"国家"包含原产国的名称。变量"userid"显示了相应tweet的作者的ID。tweet本身的ID包含在"ID"中。这两个值可以用来计算不同tweet的数量,以及对正在查找的搜索词发布tweet的不同用户的数量。"Tweet"包含Tweet的实际文本,因此构成了情绪分析的基础。

将SAP HANA连接到Twitter

智能数据访问数据存储允许SAP HANA访问并在所谓的"虚拟表"中显示来自外部系统的数据。它表示SAP HANA系统中外部系统的表格数据,而不创建副本。一旦到系统的连接终止,到表的连接也将终止。也可以通过所谓的"虚拟功能"建立对外部系统的访问。与虚拟表类似,虚拟函数表示外部系统,而不在SAP HANA中创建副本。为了通过安全连接从Twitter访问api,智能数据访问数据存储使用所谓的"DP代理"。它充当代理并将数据转发到SAP HANA平台上运行的数据供应服务器(DP服务器)。DP代理提供了几个预安装的适配器,物联网传感器,可以连接到外部系统。一旦这些适配器在激活后在SAP HANA的DP服务器上注册,就可以通过DP代理建立到相应外部系统的连接。智能数据访问数据存储允许直接从Twitter访问数据,并且由于虚拟表或虚拟函数的性质,不需要额外的存储容量。

数据准备

SAP HANA将通过虚拟函数列出的返回值存储在名为"result"的结果表中。第一步,从结果表在名为"Reduced\u Result"的视图中分隔。结论观点是对HANA进行情绪分析的出发点。在预处理中,将微博的句子分为单词和不同的短语。这些短语被称为"代币"。下一步,特征提取,是基于这些标记。它们在方面的层次上进行分析,每个标记都得到一个类型(情绪或标签,如"组织"、"人"等)。令牌类型也存储在$tau表中的一个单独的列中。下面的概述显示了$TA_表中所有可能的列。

表$TA*中的一组列

在我们的项目中,我们仅使用此表中的以下列:•键列(ID)•tau TYPE

源表tweet的ID是必要的,以便将计算视图链接到原始文本。tau TYPE列包含单个令牌的分类。例如,"SAP"一词被认为是"组织",而"like"一词被认为是"弱积极情绪"。为了确定情绪,Tau类型栏中的下列术语被认为与情绪有关:•强烈的积极情绪•积极情绪较弱•中性情绪•负面情绪较弱•小问题•强烈的负面情绪•主要问题