前言:
如今同学们对“连接hive数据库”大体比较关注,同学们都需要了解一些“连接hive数据库”的相关内容。那么小编同时在网络上汇集了一些关于“连接hive数据库””的相关资讯,希望兄弟们能喜欢,我们一起来了解一下吧!作者:朱超杰
文档编写目的
SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。Cloudera与SAS是相互认证的合作伙伴,在各自的官网都能找到集成安装的专业文档,也能得到专业的支持。本文主要介绍SAS的安装,并通过SAS访问Kerberos和非Kerberos环境下的Hive和Impala。
内容概述
1.前置准备
2.SAS安装与配置
3.非Kerberos环境集成
4.Kerberos环境集成
5.总结
测试环境
1.CM和CDH版本均为5.16.1
2.采用root用户
3.客户端系统Windows 10
4.SAS版本为9.4
SAS安装与配置
1.将下载好的安装包解压(只需解压一个即可),得到如下文件夹
2.进入解压后的文件夹,然后以管理员身份运行setup.exe
3.语言选择,选择简体中文
4.选择【安装SAS软件】
5.配置SAS的安装主目录
6.选择【安装SAS Foundation和相关软件】
7.除了SAS Bridge for Esri这一项之外,其他项全选
8.根据操作系统选择相应的版本
9.勾选全部产品,可以看到有访问Hadoop和Impala的接口
10.添加SID文件
在google上面直接查询“SID_header SAS 9.4 win 64 2019 filetype:txt”这段文字,其中9.4是SAS的版本,2019是过期的年份,还要看一下操作系统是64位还是32位的,进行相应的修改
11.先【全部清除】,然后选择【简体中文】
12.确认区域设置
13.选择【SAS Foundation(64位)】
14.指定浏览器
15.设置SAS JAVA Applet的部署目录
取消勾选SAS开机自启
16.SAS PC File Server的端口号
17.配置SAS环境url
18.此时显示客户端的主机名和端口
19.检查系统加载安装包
20.可以看到下面的提示,如果出现不可写文件,就要按照提示的步骤来操作
21.检查完成后会按照要求安装一些软件
单击【开始】则会开始安装,在之前没有装过SAS的主机上,会先安装一些基本的服务,这些是系统要求的部分,如果安装失败则必须要先中止余下的安装,想办法将这些系统要求的软件安装上才可以。在安装完一些系统要求的服务后可能会提示需要重启主机,这时需要重启主机,再来安装。在安装其他服务(非系统要求的必须服务)的时候,安装成功则会在左侧有个绿色的对号,有些服务可能会安装失败,这时没关系,可以直接继续安装,不会影响使用。
22.打开SAS主页如下
23.使用命令来查看可以使用的模块
proc setinit; run;
注意:所列出的模块必须要包含hadoop,如果没有则需要去找一个包含hadoop模块的SID文件更新一下,确定做法在安装步骤里有讲述
非Kerberos环境集成3.1 SAS客户端环境配置
1.当前集群运行正常
2.集群未启用kerberos认证
3.将/opt/Cloudera/parcels/CDH/jars目录下的所有jar包拷贝到SAS客户端目录
4.通过Cloudera Manager Web界面下载HDFS的客户端配置文件至本地
5.配置Window客户的环境变量
SAS_HADOOP_CONFIG_PATH=F:\Software_Install_Dir\hdfs-clientconfig\hadoop-confSAS_HADOOP_JAR_PATH=F:\Software_Install_Dir\jarsSAS_HADOOP_RESTFUL=1
注意:配置环境变量后为确保生效,需要重启下window机器。
6.将集群主机信息添加到本地C:\Windows\System32\drivers\etc\hosts文件中
3.2 SAS连接Hive及操作
1.打开SAS,然后执行如下代码连接Hive,并执行SQL查询
libname hive Hadoop server="192.168.0.173" database="default" user="hive" password="123456";proc sql;select * from hive.test;quit;
2.如下图所示,SAS成功连接Hive的default数据库,在SAS资源管理器左侧出现了Hive逻辑库
3.SQL查询结果如下
3.3 SAS连接Impala及操作
1.下载Impala ODBC驱动
2.双击msi文件安装Impala ODBC驱动
3.打开【控制面板主页】-> 【管理工具】-> 【ODBC 数据源(64位)】
4.单击【添加】
5.选择Impala的ODBC数据源,然后单击【完成】
6.打开SAS,执行以下代码:
libname Impala impala server="192.168.0.173" database="default" user="test1" password="123456";proc sql;select * from Impala.test;quit;
7.成功连接Impala,在SAS资源管理器中出现了Impala的逻辑库并执行表查询
标签: #连接hive数据库