He revisado tu servidor; actualmente ha vuelto a estar en línea y el estado del nodo es normal.
La causa de esta falla fue el agotamiento de la memoria: el sistema entró en un estado de intercambio (swapping) frecuente, lo que hizo que toda la máquina fuera extremadamente lenta. Tanto k3s como SSH dejaron de responder, por lo que la consola mostraba "No se puede conectar". El reinicio que ejecutaste desde la consola sí tuvo efecto, pero dado que es una máquina de 2GB de RAM, los componentes del sistema tardan unos minutos en iniciarse por completo después de un reinicio, por lo que pareció que "se arregló de repente". Actualmente, el servidor tiene cerca del 60% de sus 1.9GB de RAM en uso y está utilizando unos 500MB de espacio de intercambio, por lo que la presión de memoria sigue siendo alta.
Respondiendo a tus preguntas:
-
El servidor se ha recuperado y no es necesario reiniciarlo de nuevo.
-
Sobre el límite de memoria: Tus aplicaciones (rikkahub-web, gateway, etc.) se ejecutan directamente en el sistema y son gestionadas por PM2, no son servicios desplegados a través de Zeabur, por lo que debes configurarlo a nivel de PM2. Al añadir un límite de memoria a cada aplicación, PM2 reiniciará automáticamente el proceso si supera el límite, evitando que colapse toda la máquina:
pm2 start <archivo_de_entrada_de_la_app> --max-memory-restart 300M
pm2 save
Para las aplicaciones que ya están en ejecución, puedes eliminarlas y volver a iniciarlas con los parámetros, o añadir el campo max_memory_restart a cada aplicación en tu archivo de configuración ecosystem, ajustando el valor según el consumo real de cada una.
- Recomiendo una actualización. En una máquina de 2GB de RAM, los componentes del sistema Zeabur requieren aproximadamente 1.1GB, dejando menos de 800MB para tus aplicaciones. Actualmente dependes del espacio de intercambio, y ejecutar una o dos aplicaciones más podría causar que el problema se repita. Actualizar a una especificación de 4GB de RAM será mucho más estable.