您好,已依據後台 log 查清這次中斷的原因,說明如下:
這不是您程式或設定的問題,App 在中斷前一切正常運作(最後一筆請求約在 6/9 21:22,無任何錯誤、崩潰或記憶體不足)。
中斷的真正原因是 6/9 晚間共享叢集(Taipei 區)進行了整批節點汰換,影響時序如下(台北時間):
- 約 21:30 起,您服務所在的節點被排空,Pod 被驅逐並重新調度到新節點,服務開始中斷。
- 由於整批節點同時重新拉取映像檔,映像倉庫一度壅塞,您的映像(約 485MB)拉取耗時長達 45 分鐘,Pod 遲遲無法就緒。
- 拉取完成後 Pod 雖一度啟動成功(log 有顯示
Listening on http://0.0.0.0:8080),但在節點汰換尚未穩定的過程中卡在終止狀態(FailedKillPod / DeadlineExceeded),導致服務持續異常,直到您於 6/10 手動重新部署後才恢復。
目前服務已在新節點上穩定運行(Running、0 重啟),狀態正常,請放心。
針對這次映像拉取異常耗時的情況,我們會回饋給基礎設施團隊檢視,以降低未來節點汰換對服務的影響。
若此服務對穩定性要求較高、希望不受共享叢集節點汰換影響,也可考慮升級至 Dedicated Server(專屬伺服器),資源與節點皆為獨立隔離。
如有其他問題,請另開新的貼文,謝謝!