서버를 확인한 결과, 현재 온라인으로 복구되었으며 노드 상태는 정상입니다.
이번 장애의 원인은 메모리 부족입니다. 시스템이 잦은 페이징(swapping) 현상을 겪으면서 전체 시스템이 매우 느려졌고, k3s와 SSH 모두 응답하지 않아 콘솔에 "연결할 수 없음"으로 표시되었습니다. 콘솔에서 실행하신 재시작은 실제로 적용되었으나, 2GB 메모리 사양의 기기에서는 재부팅 후 시스템 구성 요소가 완전히 시작되기까지 몇 분이 소요되기 때문에 "갑자기 정상화된" 것처럼 보인 것입니다. 현재 서버는 1.9GB 메모리 중 약 60%를 사용 중이며, 약 500MB의 스왑 공간을 사용하고 있어 메모리 압박이 여전히 높은 상태입니다.
질문하신 내용에 대한 답변입니다:
-
서버가 정상 복구되었으므로 다시 재시작할 필요는 없습니다.
-
메모리 제한 설정: 귀하의 애플리케이션(rikkahub-web, gateway 등)은 Zeabur를 통해 배포된 서비스가 아니라 시스템 내에서 직접 실행되며 PM2로 관리되고 있으므로, PM2 수준에서 설정해야 합니다. 각 애플리케이션에 메모리 제한을 추가하면, 제한 초과 시 PM2가 자동으로 해당 프로세스를 재시작하여 전체 시스템이 다운되는 것을 방지할 수 있습니다:
pm2 start <애플리케이션 진입 파일> --max-memory-restart 300M
pm2 save
이미 실행 중인 애플리케이션은 삭제 후 매개변수를 추가하여 다시 시작하거나, ecosystem 설정 파일에 각 애플리케이션별 max_memory_restart 필드를 추가하여 실제 점유량에 맞춰 수치를 조정하십시오.
- 업그레이드를 권장합니다. 2GB 메모리 기기에서 Zeabur 시스템 구성 요소 자체가 약 1.1GB를 차지하므로, 애플리케이션에 할당할 수 있는 메모리는 800MB 미만입니다. 현재 스왑 공간에 의존하여 운영 중이므로, 애플리케이션을 한두 개 더 실행하면 재발할 가능성이 높습니다. 4GB 메모리 사양으로 업그레이드하면 훨씬 안정적으로 운영할 수 있습니다.