正如我在上一篇文章中承诺的,我将在这里分享我在本地机器上使用Windows10BashShell安装的Hadoop/Hive。
我将向您展示我的Hadoop和Hive的设置和版本。在下一篇博客中,我将展示我的本地SAP HANA Express Edition使用SDA与Hadoop/Hive的连接。
要继续,您需要确保在您的Windows 10机器上安装并运行了Ubuntu上的Bash。
我还将在相同的硬件中安装新的SAP HANA Express Edition 2.0。接下来是SAP HANA Studio、SAP IDE for HANA(运行在XS Advanced上的新的基于web的SAP HANA)、SAP EA Design和SAP SHIRE。
有关SAP HXE的更多信息,请点击此处
开始:
Windows 10上的Bash:
1。Apache Hadoop安装
新的Hadoop组安全和用户。新用户hduser需要密码(当然)
将hduser添加为sudoers以允许根权限:将hduser添加到列表
使用空密码为hduser生成SSH密钥并将密钥移动到授权的\u密钥文件。需要以hduser的身份登录
在Linux上安装Java Ubuntu:我已经安装了Java8。
确认Java已经安装:
在Linux上安装MySQL Ubuntu:我使用MySQL和Hive metastore数据库。我在Windows14.04Trusty上遇到了Bash问题。我在16.04 Xenial成功安装。
测试MySQL安装:
检查状态:
连接本地主机。需要安装密码
键:此处要求连接成功。检查状态使用"sudo/etc/init.d/mysql status":
停止mysql服务器使用:
Hadoop安装:我安装了Hadoop 2.7.3。更多信息可以在apachehadoop上找到。镜像网站上的安装文件。位置是/usr/local。解压后,我把文件夹移到hadoop上,只是为了简化一些事情
bashrc file for hduser needs changed to add the path for hadoop and Java
hadoop needs additional folders as my setup
hadoop startup files:下面的启动hadoop文件需要设置。我的安装文件位于/usr/local/hadoop/etc/hadoop。有关如何使用VI命令的更多信息,请点击此处。
然后添加/更改以下行:
sudo VI hdfs-网站.xml
sudo cp地图-site.xml.template文件映射-网站.xml
sudo vi地图-网站.xml
sudo vi纱-网站.xml
hadoop-环境sh这很重要!我的设置我正在改变SSH端口从22到60022。这让我想到我必须在这里添加一个额外的参数:
sudo vi hadoop-环境sh
格式化Hadoop HDFS文件系统
格式化HDFS文件系统之前,文件"etc/hosts"需要添加当前主机名:
sudo vi/etc/hosts,add FERNANDO-PC
创建以下文件夹../input/hdfs->它将承载datanode和namenode子文件夹
启动Hadoop服务:首先,淘客推广,确保SSH服务已启动。在我的例子中,我总是使用hduser:
如果它没有运行,请执行"sudo/etc/init.d/ssh start"。SSH需要在启动Hadoop服务之前启动。
最后,企业信息软件,我们按照以下顺序启动Hadoop服务:
如果一切正常,我们可以使用'jps'bash命令检查服务。您应该看到以下服务:
Hadoop Web界面
Hadoop附带了几个Web界面,默认情况下,这些界面在以下位置可用:
2。Apache Hive安装
下载和安装Apache Hive
从镜像下载获取。下载并解压缩文件。为了简化操作,请将文件夹移到前缀"hive"处
在~/.bashrc中创建以下条目
在hive lib目录中为连接器创建软链接或将连接器jar复制到lib文件夹。这取决于MySQL的安装。我在这里找到了:./local/hive/lib/
为hive配置MySQL Metastore,企业正版软件,MySQL需要激活。如果没有,就开始吧。需要创建用户"hiveuser",自助建站模板,以便稍后通过SAP HANA Studio与SDA连接一起使用。
创建配置单元-网站.xml(如果尚未出现)。使用配置单元文件夹
编辑配置单元中的模板-网站.xml文件如下:
确保ssh是activeHDFS命令创建配置单元目录
确保Hadoop服务启动创建配置单元目录。有些可能已经存在了,没关系授予对文件夹的访问权
为配置单元库目录中的连接器创建软链接,或将连接器jar复制到启动配置单元控制台的库文件夹。这可能是必需的。这是关于错误消息"("com.mysql.jdbc网站在类路径中找不到".Driver")。更多细节在这里。
启动蜂巢控制台:要启动蜂巢,只需键入"蜂巢"。我的安装程序偶尔会失败,说"Hadoop节点不在安全模式"。当发生这种情况时,只需执行以下操作:
除此之外,还应弹出配置单元控制台。尝试键入"show databases";例如
运行HiveServer2和Beeline
需要启动HiveServer2服务以允许JDBC连接
非常重要:运行HiveServer2服务的"Bash on Windows"部分将被锁定。我花了一段时间才弄明白。我们需要打开一个新的"Bash-on-Windows部分"并保留该部分。
使用一个新的Bash部分,我们可以通过简单地键入"jps"来检查HiveServer2是否已启动并运行。服务"RunJar"表示
Beeline console:使用localhost和hive port 1000的Beeline console(与SAP SDA连接的DSN文件中使用的相同)。在这种情况下,我们只测试是否可以连接到配置单元:
在我的安装中,用户是"hduser"。密码是必需的。
一些直线命令:
仅此而已。这意味着Hiveserver2正在运行,端口10000正在监听任何JDBC/ODBC连接。
,人工智能大数据