当前位置: 首页 > news >正文

一次Oracle的非正常关闭

数据库自己会关闭吗?

从现象来说Oracle MySQL Redis等都会出现进程意外停止的情况。而这些停止都是非人为正常关闭或者暴力关闭(abort或者kill 进程)

一次测试环境的非关闭

一般遇到这种情况先看一下错误日志吧。

2025-06-01T06:26:06.352576+08:00
PMON (ospid: ): terminating the instance due to ORA error
2025-06-01T06:26:06.374973+08:00
Cause - ‘Instance is being terminated due to fatal process death (pid: 14, ospid: 118685, DBRM)’
2025-06-01T06:26:06.968910+08:00
System state dump requested by (instance=1, osid=118660 (PMON)), summary=[abnormal instance termination].
System State dumped to trace file /u01/oracle/diag/rdbms/uatsoc/uatsoc/trace/uatsoc_diag_118680.trc
2025-06-01T06:26:12.505063+08:00
Instance terminated by PMON, pid = 118660

从字面翻译:由于进程死亡,实例正在终止。这里提到一个关键字DBRM。按说应该是Oracle资源管理器(Oracle Database Resource Manager,简称DBRM)管理数据库的资源分配。那么一般都是CPU、IO和内存之类的。就去这些看看。
从trace文件中看到一开始(一般外国人的产品思维先把重要的写在前面)

image.png

俗话说:事情出现之前都有先兆(我说的)

  • 通常这种情况下我会先看一下出问题之前的最近的AWR

  • 第一个等待事件非常少见。Failed Logon Delay这个异常一般都是因为有自动或者定时任务的程序使用的用户名和密码错误引起的。只能猜测不停地连接,而Oracle为了防止暴力破解,每次输入错误,会延迟下一次输入的时间。这个就行手机密码错了,然后要再多一段时间才行。但是一般来说不至于说登录密码错误多了就导致数据库奔溃。

    image.png

  • 似乎内存分配的多了一点。SGA和PGA占了物理内存86%左右。这是出问题前30分钟的AWR后面就没有生成了。

  • image.png

  • 只能靠ASH看看有没有进一步的信息。
    select session_type,event,session_state from dba_hist_active_sess_history t where t.SAMPLE_TIME>to_date(‘2025-06-01 06:00’,‘yyyy-mm-dd hh24:mi’) and t.SAMPLE_TIME<to_date(‘2025-06-01 06:26’,‘yyyy-mm-dd hh24:mi’)

  • 结果大致是这样的:

  • image.png

  • PX Deq: Join ACK这个我没有专门研究过,直到现在依然发现还有很多不懂的。

  • 以我个人愚见:这些进程自动死亡(trace中的确写了很多进程死掉了)

  • 那么为什么进程死掉?结合刚才说的错误等待和内存占用高,可能是内存不足?

  • 查找message日志

    image.png

看到这里的确是oom被系统kill了。还提到了swap用完了。

  • 当然这本身和分配过大有关。
  • 为什么要分配这么大?因为测试环境的SQL质量不高,SGA和PGA都有很高的占用

记录一下这个案例

  • 给数据库分配内存过大是迁就
  • 根本上还是要SQL治理
http://www.lqws.cn/news/158023.html

相关文章:

  • 十八、【用户认证篇】安全第一步:基于 JWT 的前后端分离认证方案
  • Cursor 1.0 版本 GitHub MCP 全面指南:从安装到工作流增强
  • oracle数据恢复—oracle数据库执行truncate命令后的怎么恢复数据?
  • 大疆相关知识收集
  • 深度解码:我如何用“结构进化型交互学习方法”与AI共舞,从学习小白到构建复杂认知体系
  • 从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
  • 短视频矩阵系统技术saas源头6年开发构架
  • 【SSM】SpringMVC学习笔记7:前后端数据传输协议和异常处理
  • 05【Linux经典命令】Linux 用户管理全面指南:从基础到高级操作
  • Hive中ORC存储格式的优化方法
  • 服务器CPU被WMI Provider Host系统进程占用过高,导致系统偶尔卡顿的排查处理方案
  • 26考研 | 王道 | 计算机组成原理 | 四、指令系统
  • [蓝桥杯]堆的计数
  • 第14节 Node.js 全局对象
  • 华为云CentOS配置在线yum源,连接公网后,逐步复制粘贴,看好自己对应的版本即可,【新手必看】
  • 《中国电信运营商骨干网:历史、现状与未来演进》系列 第三篇:双网驱动的联通:从南北分家到CUBE-Net的融合创新
  • Java 异步编程难题及拆解技术
  • STL——栈和队列和优先队列
  • 谐波在线监测装置功能
  • Java八股文——集合「Queue篇」
  • LangchainRAG you need - 段落拆分
  • 欧拉公式简明推导
  • 【Android基础回顾】七:内存管理机制
  • 2025.5.28【33OJ NOI 模拟赛 T3】字符串(AC自动机, 字符串后缀结构)
  • Mybatis动态SQL语句
  • 【iSAQB软件架构】软件架构中构建块的视图:黑箱、灰箱和白箱及其交互机制
  • 2025年渗透测试面试题总结-腾讯[实习]玄武实验室-安全工程师(题目+回答)
  • 数据驱动的智驾十年 特斯拉、Momenta合流闯进Robotaxi卫冕之战
  • Java应用10(客户端与服务器通信)
  • Postman环境变量全局变量设置