您好,
我们查了这台服务器(Tencent Tokyo, 43.130.246.201)的状态:
原因:
ingress-controller 这个组件一直卡在 STARTING 状态(从未成功启动,时间戳停留在 1970-01-01),所以整台服务器上的服务都无法对外访问。其他系统组件(DNS、log-api、fluent-bit、node-exporter 等)都是正常运行的,资源也充足(CPU 10%、内存 50%),所以不是资源不足的问题。
重启 + 多次「重装 Zeabur 系统组件」之所以都失败,是因为 ingress-controller 每次启动都被同一个原因挡住。根据以往类似案例,最常见的原因是服务器主机上有其他程序占用了 port 80 或 443(例如系统自带的 nginx 在重启后自动启动),导致 ingress-controller 无法绑定端口、反复 crash。
Zeabur 的 k3s 需要独占以下端口:
| Port | 用途 |
|---|
| 80 | HTTP |
| 443 | HTTPS(ingress-controller) |
| 4222 | Zeabur 管理通讯 |
| 6443 | Kubernetes API |
| 30000–32767 | NodePort |
请协助以下排查:
- SSH 登入服务器后执行:
sudo ss -tlnp | grep -E ':(80|443)\b'
sudo lsof -i :80
sudo lsof -i :443
- 如果发现
nginx、apache 或其他程序占用了 80/443,请停止并禁用它(以 nginx 为例):
sudo systemctl stop nginx && sudo systemctl disable nginx
- 停止后等待 1–2 分钟,ingress-controller 会自动重新绑定并恢复,所有服务也会随之回到正常。
如果 80/443 并没有被占用,请把以下命令的输出贴回来,我们继续查 pod 层面的具体错误:
sudo k3s kubectl -n zeabur get pods -o wide | grep ingress
sudo k3s kubectl -n zeabur describe pod <ingress-pod-name>
sudo k3s kubectl -n zeabur logs <ingress-pod-name> --previous