云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

腾讯云_新加坡服务器_年度促销

小七 141 0

正如我在上一篇文章中承诺的,我将在这里分享我在本地机器上使用Windows10BashShell安装的Hadoop/Hive。

我将向您展示我的Hadoop和Hive的设置和版本。在下一篇博客中,我将展示我的本地SAP HANA Express Edition使用SDA与Hadoop/Hive的连接。

要继续,您需要确保在您的Windows 10机器上安装并运行了Ubuntu上的Bash。

我还将在相同的硬件中安装新的SAP HANA Express Edition 2.0。接下来是SAP HANA Studio、SAP IDE for HANA(运行在XS Advanced上的新的基于web的SAP HANA)、SAP EA Design和SAP SHIRE。

有关SAP HXE的更多信息,请点击此处

开始:

Windows 10上的Bash:

1。Apache Hadoop安装

新的Hadoop组安全和用户。新用户hduser需要密码(当然)

将hduser添加为sudoers以允许根权限:将hduser添加到列表

使用空密码为hduser生成SSH密钥并将密钥移动到授权的\u密钥文件。需要以hduser的身份登录

在Linux上安装Java Ubuntu:我已经安装了Java8。

确认Java已经安装:

在Linux上安装MySQL Ubuntu:我使用MySQL和Hive metastore数据库。我在Windows14.04Trusty上遇到了Bash问题。我在16.04 Xenial成功安装。

测试MySQL安装:

检查状态:

连接本地主机。需要安装密码

键:此处要求连接成功。检查状态使用"sudo/etc/init.d/mysql status":

停止mysql服务器使用:

Hadoop安装:我安装了Hadoop 2.7.3。更多信息可以在apachehadoop上找到。镜像网站上的安装文件。位置是/usr/local。解压后,我把文件夹移到hadoop上,只是为了简化一些事情

bashrc file for hduser needs changed to add the path for hadoop and Java

hadoop needs additional folders as my setup

hadoop startup files:下面的启动hadoop文件需要设置。我的安装文件位于/usr/local/hadoop/etc/hadoop。有关如何使用VI命令的更多信息,请点击此处。

然后添加/更改以下行:

sudo VI hdfs-网站.xml

sudo cp地图-site.xml.template文件映射-网站.xml

sudo vi地图-网站.xml

sudo vi纱-网站.xml

hadoop-环境sh这很重要!我的设置我正在改变SSH端口从22到60022。这让我想到我必须在这里添加一个额外的参数:

sudo vi hadoop-环境sh

格式化Hadoop HDFS文件系统

格式化HDFS文件系统之前,文件"etc/hosts"需要添加当前主机名:

sudo vi/etc/hosts,add FERNANDO-PC

创建以下文件夹../input/hdfs->它将承载datanode和namenode子文件夹

启动Hadoop服务:首先,淘客推广,确保SSH服务已启动。在我的例子中,我总是使用hduser:

如果它没有运行,请执行"sudo/etc/init.d/ssh start"。SSH需要在启动Hadoop服务之前启动。

最后,企业信息软件,我们按照以下顺序启动Hadoop服务:

如果一切正常,我们可以使用'jps'bash命令检查服务。您应该看到以下服务:

Hadoop Web界面

Hadoop附带了几个Web界面,默认情况下,这些界面在以下位置可用:

2。Apache Hive安装

下载和安装Apache Hive

从镜像下载获取。下载并解压缩文件。为了简化操作,请将文件夹移到前缀"hive"处

在~/.bashrc中创建以下条目

在hive lib目录中为连接器创建软链接或将连接器jar复制到lib文件夹。这取决于MySQL的安装。我在这里找到了:./local/hive/lib/

为hive配置MySQL Metastore,企业正版软件,MySQL需要激活。如果没有,就开始吧。需要创建用户"hiveuser",自助建站模板,以便稍后通过SAP HANA Studio与SDA连接一起使用。

创建配置单元-网站.xml(如果尚未出现)。使用配置单元文件夹

编辑配置单元中的模板-网站.xml文件如下:

确保ssh是activeHDFS命令创建配置单元目录

确保Hadoop服务启动创建配置单元目录。有些可能已经存在了,没关系授予对文件夹的访问权

为配置单元库目录中的连接器创建软链接,或将连接器jar复制到启动配置单元控制台的库文件夹。这可能是必需的。这是关于错误消息"("com.mysql.jdbc网站在类路径中找不到".Driver")。更多细节在这里。

启动蜂巢控制台:要启动蜂巢,只需键入"蜂巢"。我的安装程序偶尔会失败,说"Hadoop节点不在安全模式"。当发生这种情况时,只需执行以下操作:

除此之外,还应弹出配置单元控制台。尝试键入"show databases";例如

运行HiveServer2和Beeline

需要启动HiveServer2服务以允许JDBC连接

非常重要:运行HiveServer2服务的"Bash on Windows"部分将被锁定。我花了一段时间才弄明白。我们需要打开一个新的"Bash-on-Windows部分"并保留该部分。

使用一个新的Bash部分,我们可以通过简单地键入"jps"来检查HiveServer2是否已启动并运行。服务"RunJar"表示

Beeline console:使用localhost和hive port 1000的Beeline console(与SAP SDA连接的DSN文件中使用的相同)。在这种情况下,我们只测试是否可以连接到配置单元:

在我的安装中,用户是"hduser"。密码是必需的。

一些直线命令:

仅此而已。这意味着Hiveserver2正在运行,端口10000正在监听任何JDBC/ODBC连接。

,人工智能大数据