你好,帮你看了一下: 服务器在 2026-05-12 10:11 UTC 触发了 OOM(内存耗尽),内核杀掉了一个 Node.js 进程后系统自动关机重启,目前已恢复运行 22+ 小时。 你的服务器是 cpx41(16 GiB 内存),上面跑了 7 个项目大约 35+ 个 pod。你在 5/6 刚从 cpx31(8 GiB)升上来,6 天后又撞到了内存上限。当前重启后内存使用 4.7 GiB,但随着服务运行时间变长内存会逐渐累积。 建议检查一下各服务的内存使用趋势,尤其是内存占用最大的几个(目前最大的单个服务占了 ~700 MiB)。如果有服务存在内存泄漏,可以设置 resource limit 让单个容器 OOM 而不是拖垮整台机器。
This post has been inactive for a while. We will be closing it in 2 days if there is no new activity.