RHCS集群:巡检 + 脚本

By | 2018年1月18日

手动巡检:

检查集群状态:

工具:cman_tool

集群节点状态,包含加入时间:

脚本:

以上脚本是第一版,没有灵活的根据当前的集群状况判断,而是将判断条件写死了。
后面有时间的话,会改进灵活度。

————————————————
Done。

AIX – error:chfs: 0506-932 Can not extend a JFS file system with nbpi = 4096

By | 2018年1月18日

今天,AIX扩容的时候遇到了如题所示的报错,具体如下:

看看这个时候的LV状态:

可以按照这种方式重新创建LV:

具体如下:

这样就操作成功了

————————
Done

Cloudera – NameNode error:Supervisor 返回 FATAL

By | 2018年1月17日

如题所示的错误发生在Cloudera的HDFS的NameNode启动的时候,具体如下:

如果用命令启动,会看到更多的信息:

首先看看出问题的节点上,NameNode存放在哪里:

看看文件的权限:

修改权限:

然后,再次启动NameNode:

这[……]

Read more

Cloudera:ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: Failed to start namenode. java.io.IOException: NameNode is not formatted.

By | 2018年1月17日

如题所示的错误发生在Cloudera安装的过程中,可能有的节点没有被格式化。

具体如下:

解决:
在问题节点数上执行:

——————————————————————
Done。