Clúster K3s en VPS desconectado e inaccesible, sospecha de bloqueo del sistema por agotamiento de memoria

Waiting for author response

Ccallie0313FREEHace 1d

Hola, mi VPS (Tencent Frankfurt 2C 2GB) se ha vuelto inaccesible de repente. Aquí están los detalles:

Descripción del problema:

El estado del clúster K3s muestra "Desconectado"
No se puede conectar vía SSH (el puerto 22 está abierto)
Zeabur Web Terminal tampoco funciona
La consola muestra "No se puede conectar"

Acciones intentadas:

Reiniciar K3s: Sin efecto
Reiniciar todo el VPS: Sin efecto
Comprobar la configuración del firewall: La configuración de puertos es correcta

Solicitud de ayuda:

¿Podrían ayudarme a reiniciar mi VPS para restaurar la conexión?
¿Cómo puedo establecer límites de memoria para cada servicio para evitar que esto vuelva a ocurrir?
¿Se recomienda actualizar a una especificación con mayor memoria?

¡Gracias!

2 respuestas

Ccallie0313FREEHace 1d

De repente funciona bien. ¿Necesito comprar un servidor más grande?

CPU: 4% (Normal)
Memoria: 68% (1316MB/1935MB)
Disco: 43% (Normal)

CCanEMPLOYEEHace 20h

He revisado tu servidor; actualmente ha vuelto a estar en línea y el estado del nodo es normal.

La causa de esta falla fue el agotamiento de la memoria: el sistema entró en un estado de intercambio (swapping) frecuente, lo que hizo que toda la máquina fuera extremadamente lenta. Tanto k3s como SSH dejaron de responder, por lo que la consola mostraba "No se puede conectar". El reinicio que ejecutaste desde la consola sí tuvo efecto, pero dado que es una máquina de 2GB de RAM, los componentes del sistema tardan unos minutos en iniciarse por completo después de un reinicio, por lo que pareció que "se arregló de repente". Actualmente, el servidor tiene cerca del 60% de sus 1.9GB de RAM en uso y está utilizando unos 500MB de espacio de intercambio, por lo que la presión de memoria sigue siendo alta.

Respondiendo a tus preguntas:

El servidor se ha recuperado y no es necesario reiniciarlo de nuevo.
Sobre el límite de memoria: Tus aplicaciones (rikkahub-web, gateway, etc.) se ejecutan directamente en el sistema y son gestionadas por PM2, no son servicios desplegados a través de Zeabur, por lo que debes configurarlo a nivel de PM2. Al añadir un límite de memoria a cada aplicación, PM2 reiniciará automáticamente el proceso si supera el límite, evitando que colapse toda la máquina:

pm2 start <archivo_de_entrada_de_la_app> --max-memory-restart 300M
pm2 save

Para las aplicaciones que ya están en ejecución, puedes eliminarlas y volver a iniciarlas con los parámetros, o añadir el campo max_memory_restart a cada aplicación en tu archivo de configuración ecosystem, ajustando el valor según el consumo real de cada una.

Recomiendo una actualización. En una máquina de 2GB de RAM, los componentes del sistema Zeabur requieren aproximadamente 1.1GB, dejando menos de 800MB para tus aplicaciones. Actualmente dependes del espacio de intercambio, y ejecutar una o dos aplicaciones más podría causar que el problema se repita. Actualizar a una especificación de 4GB de RAM será mucho más estable.

Agregar respuesta

Foro

2 respuestas