当前位置: 首页 > news >正文

Hadoop集群异常:两个NameNode全部为StandBy状态

今天启动Yarn的ResourceManager出错了,报错说是namenode状态错误:

Operation category READ is not supported in state standby.

用命令查看:

[root@dmp-mng-svr1 zookeeper-3.5.10]# hdfs haadmin -getServiceState nn1
standby
[root@dmp-mng-svr1 zookeeper-3.5.10]# hdfs haadmin -getServiceState nn2
standby

什么?两个namenode都是standby,都不想干活了吗?
网上查了一下,说是强制转其中一台为active,

hdfs haadmin -transitionToActive --forcemanual nn1
或者
hdfs haadmin -failover nn1 nn2

失败了
还有一说是重置zkfc数据:

hdfs zkfc -formatZK 

但还是不行。是不是zookeeper出问题了?我早上重新生成了zookeeper的krb5证书,可能是不行了吧,尝试重启zookeeper,果真不能启动了,于是删除了zookeeper的数据目录,重建myid文件
再重新启动,又报错:

java.io.IOException: No snapshot found, but there are log entries. Something is broken!

重置zk试试:

./bin/zkServer-initialize.sh --force

然后再重建myid文件。这下zk启动成功了。
再启动journalnode,成功。
启动namenode,失败。于是格式化:

主:sudo -u hdfs /opt/datasophon/hadoop-3.3.3/bin/hdfs namenode -format
从:sudo -u hdfs /opt/datasophon/hadoop-3.3.3/bin/hdfs namenode -bootstrapStandby
/opt/datasophon/hadoop-3.3.3/bin/hdfs zkfc -formatZK

这下终于启动成功了。

http://www.lqws.cn/news/560845.html

相关文章:

  • 【中文核心期刊推荐】《计算机工程与设计》
  • linux学习第26天(信号集)
  • llm 基本案例实现
  • 从OCR瓶颈到结构化理解来有效提升RAG的效果
  • C++ - 浅看vector源码
  • SpringBoot -- 以 jar 包运行(以及常见错误分析)
  • HarmonyOS NEXT仓颉开发语言实战案例:动态广场
  • Java面试题030:一文深入了解MySQL(2)
  • SpringMVC系列(六)(Restful架构风格(中))
  • Python助力自动驾驶:深度学习模型优化全攻略
  • 什么是 PoS(权益证明)
  • 如何用VS Code、Sublime Text开发51单片机
  • uni-app subPackages 分包加载:优化应用性能的利器
  • Geollama 辅助笔记:raw_to_prompt_strings_geo.py
  • IDEA2024.3 tomcat需要按两次停止按钮停止问题
  • 区块链使用那些技术?
  • 太速科技-670-3U VPX PCIe桥扩展3路M.2高速存储模块
  • Linux测试是否能联网
  • 大事件项目记录8-文章分类接口开发-文章分类列表
  • 2025年健康医疗大数据开放共享:现状、挑战与未来发展
  • 计算机操作系统(十七)内存管理
  • Grab×亚矩阵云手机:以“云端超级节点”重塑东南亚出行与数字生活生态
  • 用鸿蒙打造真正的跨设备数据库:从零实现分布式存储
  • 【AI智能体】Dify 核心组件从使用到实战操作详解
  • 信号处理学习——文献精读与code复现之TFN——嵌入时频变换的可解释神经网络(上)
  • 数据湖 vs 数据仓库:数据界的“自来水厂”与“瓶装水厂”?
  • 阿里 Qwen3 模型更新,吉卜力风格get
  • 对话式数据分析与Text2SQL Agent产品可行性分析思考
  • 安卓中静态和动态添加子 View 到容器
  • Zotero 7 插件:翻译与护眼主题