Happy Path: Setup HA solution for HDFS under Fully Distributed Operation

2 minute read

this article will cover the HA solution for Hadoop under Fully Distributed.

source link

Prerequisite

have a hadoop cluster running under fully distributed operation

nodes	ip	NN	JN	DN	ZKFC	ZK
node01	192.168.157.11	✅	✅		✅
node02	192.168.157.12	✅	✅	✅	✅	✅
node03	192.168.157.13		✅	✅		✅
node04	192.168.157.14			✅		✅

setup passwordless between node01 and node02
- because ZKFC need to know the status of each NN
in each node, run ssh-keygen -t dsa -P '' -f ./id_dsa
cat id_dsa.pub >> authorized_keys
ssh localhost to verify no password needed
scp id_dsa.pub node02:'pwd'/node02.pub
on node01, cat node02.pub >> authorized_keys

vi zoo.cfg

server.1=node02:2888:3888
server.2=node03:2888:3888
server.3=node04:2888:3888

mkdir -p /var/bigdata/hadoop/zk
in zk folderecho <weight> >> myid
- depends on the weight you assigned in zoo.cfg
vi /ect/profile
- add zookeeper bin into PATH variables
spread the zookeeper folders to node03 and node04
scp -r apache-zooke... node03:'pwd'
on node03 and node04
- mkdir -p /var/bigdata/hadoop/zk
- echo <weight> > myid
- vi /etc/profile
  - add zookeeper into path variable

start JournalNode
- on node01
  - hadoop-daemon.sh start journalnode
  - jps
    - 8543 JournalNode
- on node02
  - hadoop-daemon.sh start journalnode
- on node03
  - hadoop-daemon.sh start journalnode
  - cd $HADOOP/logs
    - tail -f hadoop-root-journalnode-node03.log
      - INFO org.apache.hadoop.ipc.Server: IPC Server listener on 8485: starting
Reformat NameNode
- on node01
  - hdfs namenode -format
    - Storage directory /var/bigdata/hadoop/ha/dfs/name has been successfully formatted.
    - then all journal node will create folders /var/bigdata/hadoop/ha/dfs/jn/mycluster/current on its own machine, VERSION are same with NameNode
- start NameNode and its Standby
  - on node01
    - hadoop-daemon.sh start namenode
    - know what’s the VERSION
  - on node02
    - hdfs namenode -bootstrapStandby
      - new folder are created /var/bigdata/hadoop/ha/dfs/name/current
Reformat ZK
- on node04
  - zkCli.sh
    - ls /
      - [zookeeper]
- on node01
  - hdfs zkfc -formatZK
- back to node04
  - zkCli.sh
    - ls /
      - [hadoop-ha, zookeeper]
on node01
- start-dfs.sh
open 192.168.157.11:50070
open 192.168.157.12:50070
on nod04
- ls /hadoop-ha/mycluster
  - [ActiveBreadCrumb, ActiveStandbyElectorLock]
- get /hadoop-ha/mycluster/ActiveStandbyElectorLock