Ambari服务组件常见问题

编辑
文档创建者:doreen0813 (83193 )     浏览次数:453次     编辑次数:4次     最近更新:doreen0813 于 2018-10-24     

目录:

1、Ambari重启编辑

在集群主节点上(安装了ambari-server的机器)使用root用户执行如下操作:

ambari-server 启动:ambari-server start

ambari-server 关闭:ambari-server stop

amabri-server 重启:amabri-server restart

注:这边只是控制ambari-server服务,并不会控制ambari下安装的服务(spark,hdfs,zookeeper,alluxio,这些服务需要在amabri-server的web页面上操作)。

重启服务顺序:依次启动ZooKeeper->HDFS->Spark2->Alluxio。

2、集群服务器开机自启动设置编辑

默认情况下,集群环境中只有ambari-server会自动重启,如果想要设置其他服务的自启动,需要手动配置。

在ambari主界面上点击右上角的Admin标签,下拉框中选择Service Auto Start,如下图:

确保Auto-Start Service按钮处于Enabled的状态,如下图所示:

点击下面ALLUXIO,HDFS,Spark2以及ZooKeeper的标签,将这几个服务中所有的组件都设置成Enable的状态:

Alluxio:

HDFS:

Spark2:

ZooKeeper:

若安装了Ambari Metrics,请同样配置开机自启动。设置完毕后,点击右上角的Save按钮即可,如下图,这些设置过的服务会在机器启动的时候自动启动。

3、服务安装完启动后一开始显示为启动,过一会显示服务停止编辑

可能原因:

由于ambari是通过每隔一段时间检测进程是否存在来判断服务是否正在运行的,服务状态检测存在一定的延迟。有些服务,例如zookeeper等,可能启动的时候进程是存在的,但是由于一些原因报错,之后也会结束zookeeper自己的进程。因此,如果如果服务启动不正常,会出现过一会服务停止的情况。

解决方案:

没有启动的服务,通过Ambari的UI界面手动启动一下看看,如果依旧如此,就请检查各个服务的日志(HDFS, ZOOKEEPER,HDFS,SPARK2的日志目录默认是在/var/log下,alluxio日志的默认目录是在/home/hdfs/data/alluxio/log下),查看失败原因,具体原因具体解决。

4、关于预警问题编辑

目前不用管Ambari Metrix 和 Smart Scense的预警和报错(服务处于stop也没有影响),其他的服务(Zookeeper, HDFS, SPARK2, Alluxio)的预警和报错需要具体情况具体分析,可以点开alert查看具体内容,例如hdfs的datanode剩余空间百分比过低时会有如下提示:

这种问题需要根据实际情况考虑是否处理。

5、关于服务状态问题编辑

最基础的服务状态就是检查每一个服务标签页中的各个组件状态,如下图的Spark2:

Started就是处于工作状态,其他的红色状态就表示未工作状态(目前只需要保证HDFS、ZooKeeper、Spark2、Alluxio的组件处于Started状态)。如果服务是stoped的状态,可以手动点击stop的组件进去,手动启动该组件。

6、Postgresql问题编辑

Ambari底层依赖postgre sql来保存集群中的各个节点和服务的信息,默认节点机器的postgre sql服务是处于正常开启状态,但是有的系统中postgre sql并不处于正常状态,所以就需要手动重启postgre sql服务。

7、安装HDFS配置界面NameNode和DataNode Directories报错提示编辑

由于Ambari默认不允许把这两个文件夹的路径放置在/home路径下,因此安装的时候可能会遇到类似如下图所示的问题:

解决方案:

一般情况下只需要留第一个非/home的路径即可,如果不可以的话,请按照下面的方式创建软链接来处理这个问题。

以图中的/hadoop路径为例(在集群中每台机器中都要操作):

1、将/hadoop复制到/home/hadoop(带上权限)  

cp -rp /hadoop /home/hadoop

2、删除/hadoop  

rm -rf /hadoop

3、将/home/hadoop软连接到根目录/   

ln -s /home/hadoop /

8、系统环境检查编辑

在集群各个节点安装服务之前,Ambari会对集群中的各个机器做一个环境检查。如果不是新装的操作系统,可能会有一些环境问题,点击后可以详细查看警告内容,手动解决即可。如下图所示:

点击warnings后会有详细信息,如:

按照详细提示信息解决即可。

9、安装服务过程中弹出的红色警告编辑

安装过程中,Ambari会检测集群机器的状态以及配置服务的信息,会给出一些相应的建议提示和警告,如下图所示:

Ambari Metrix的相关警告可以忽略,其他服务的警告需要根据具体内容具体分析是否忽略还是做出配置上的调整。


附件列表


主题: 部署集成
标签: 暂无标签 编辑/添加标签
如果您认为本文档还有待完善,请编辑

文档内容仅供参考,如果你需要获取更多帮助,付费/准付费客户请咨询帆软技术支持
关于技术问题,您还可以前往帆软社区,点击顶部搜索框旁边的提问按钮
若您还有其他非技术类问题,可以联系帆软传说哥(qq:1745114201

本文档是否有用? [ 去社区提问 ]