主页 > 其他 >

3.hadoop3.3.6HA集群搭建

其他
2025-08-30 03:42:03

1.服务器规划

软件版本参考： cloud.google /dataproc/docs/concepts/versioning/dataproc-release-2.2?hl=zh-cn

hadoop HA, 主要分为HDFS的HA和YARN的HA。

集群规划

2.预先准备 2.1.ssh免密登录 ssh-keygen -t rsa 2.2 jdk 安装

略

2.3 配置host sudo vim /etc/hosts

10.128.0.18 hadoop01 10.128.0.21 hadoop02 10.128.0.22 hadoop03

前面为机器对应的内网ip。

3.hadoop配置

环境变量参考 /etc/profile.d/my_env.sh

export JAVA_HOME=/opt/apps/jdk export HADOOP_HOME=/opt/apps/hadoop export ZK_HOME=/opt/apps/zookeeper export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZK_HOME/bin:$PATH

core-site.xml

hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>   <configuration>  <property> <name>dfs.namenode.name.dir</name> <value>file://${hadoop.tmp.dir}/name</value> </property>  <property> <name>dfs.datanode.data.dir</name> <value>file://${hadoop.tmp.dir}/data</value> </property>  <property> <name>dfs.journalnode.edits.dir</name> <value>${hadoop.tmp.dir}/jn</value> </property>  <property> <name>dfs.nameservices</name> <value>bits</value> </property>  <property> <name>dfs.ha.namenodes.bits</name> <value>nn1,nn2,nn3</value> </property>  <property> <name>dfs.namenode.rpc-address.bits.nn1</name> <value>hadoop01:8020</value> </property> <property> <name>dfs.namenode.rpc-address.bits.nn2</name> <value>hadoop02:8020</value> </property> <property> <name>dfs.namenode.rpc-address.bits.nn3</name> <value>hadoop03:8020</value> </property>  <property> <name>dfs.namenode.http-address.bits.nn1</name> <value>hadoop01:9870</value> </property> <property> <name>dfs.namenode.http-address.bits.nn2</name> <value>hadoop02:9870</value> </property> <property> <name>dfs.namenode.http-address.bits.nn3</name> <value>hadoop03:9870</value> </property>  <property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property>  <property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/bits</value> </property>  <property> <name>dfs.client.failover.proxy.provider.bits</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property>  <property> <name>dfs.ha.fencing.methods</name> <value>shell(/bin/true)</value> </property> </configuration>

yarn-site.xml

<?xml version="1.0"?>  <configuration>  <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property>  <property> <name>yarn.resourcemanager.ha.enabled</name> <value>true</value> </property>  <property> <name>yarn.resourcemanager.recovery.enabled</name> <value>true</value> </property>  <property> <name>yarn.resourcemanager.cluster-id</name> <value>cluster-yarn1</value> </property>  <property> <name>yarn.resourcemanager.ha.rm-ids</name> <value>rm1,rm2,rm3</value> </property>   <property> <name>yarn.resourcemanager.hostname.rm1</name> <value>hadoop01</value> </property>  <property> <name>yarn.resourcemanager.webapp.address.rm1</name> <value>hadoop01:8088</value> </property>  <property> <name>yarn.resourcemanager.address.rm1</name> <value>hadoop01:8032</value> </property>  <property> <name>yarn.resourcemanager.scheduler.address.rm1</name> <value>hadoop01:8030</value> </property>  <property> <name>yarn.resourcemanager.resource-tracker.address.rm1</name> <value>hadoop01:8031</value> </property>   <property> <name>yarn.resourcemanager.hostname.rm2</name> <value>hadoop02</value> </property> <property> <name>yarn.resourcemanager.webapp.address.rm2</name> <value>hadoop02:8088</value> </property> <property> <name>yarn.resourcemanager.address.rm2</name> <value>hadoop02:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address.rm2</name> <value>hadoop02:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address.rm2</name> <value>hadoop02:8031</value> </property>   <property> <name>yarn.resourcemanager.hostname.rm3</name> <value>hadoop03</value> </property>  <property> <name>yarn.resourcemanager.webapp.address.rm3</name> <value>hadoop03:8088</value> </property>  <property> <name>yarn.resourcemanager.address.rm3</name> <value>hadoop03:8032</value> </property>  <property> <name>yarn.resourcemanager.scheduler.address.rm3</name> <value>hadoop03:8030</value> </property>  <property> <name>yarn.resourcemanager.resource-tracker.address.rm3</name> <value>hadoop03:8031</value> </property>  <property> <name>yarn.resourcemanager.zk-address</name> <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value> </property>  <property> <name>yarn.resourcemanager.store.class</name> <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value> </property>  <property> <name>yarn.nodemanager.env-whitelist</name> <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value> </property> </configuration>

mapred-site.xml

<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>   <configuration>  <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>

workers

hadoop01 hadoop02 hadoop03

注意：该文件中添加的内容结尾不允许有空格，文件中不允许有空行。

4.启动集群

配置好环境变量略

格式化集群第一次需要。如果需要重新格式化，需要删除集群中的data和logs目录。

启动JournalNode 在各个 JournalNode 节点上，输入以下命令启动 journalnode 服务

hdfs --daemon start journalnode

在[nn1]上，对其进行格式化，并启动

hdfs namenode -format hdfs --daemon start namenode

在[nn2]和[nn3]上，同步 nn1 的元数据信息

hdfs namenode -bootstrapStandby

启动[nn2]和[nn3]

hdfs --daemon start namenode

启动hdfs

sbin/start-dfs.sh

启动yarn ResourceManager要在配置为ResourceManager的节点上启动。

sbin/start-yarn.sh 5.问题解决

1.namenode挂了，无法自动完成主从切换，需要重新起来才行。

<property> <name>dfs.ha.fencing.methods</name> <value>sshfence</value> </property>  <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/home/dev/.ssh/id_rsa</value> </property>

解决：隔离机制配置为sshfence，如果一台机器挂了，新的主会执行一次杀死原主namenode的操作，如果挂了，这一步执行不通。会导致集群卡在这里，需要人工把namenode启动起来，然后集群会自动选主。这里主要是为了防止脑裂。将上面的配置改为

<property> <name>dfs.ha.fencing.methods</name> <value>shell(/bin/true)</value> </property>

或者其他的shell命令。但是这时候，需要自己考虑脑裂的问题。

标签：

3.hadoop3.3.6HA集群搭建由讯客互联其他栏目发布，感谢您对讯客互联的认可，以及对我们原创作品以及文章的青睐，非常欢迎各位朋友分享到个人网站或者朋友圈，但转载请说明文章出处“3.hadoop3.3.6HA集群搭建”

上一篇
利用pico4ultra提高生产力与学习效率的可行性方案

下一篇
mybatis-mp正式改名为xbatis!!!