共享集群服务（腾讯新加坡）出现间歇性 Cloudflare 524 错误 + Shell/SSH 访问问题

Resolved

Nnerdai0FREE2026/6/2

嗨 Zeabur 团队，

服务：[NERD AI] 腾讯新加坡 2C 4GB (service-69ff7d3c4a961c814e9ec119) ← 请确认/替换区域/方案：腾讯新加坡 — 共享集群 (Shared Cluster)，2 vCPU / 4 GB RAM 状态：运行中

问题 1 — 在服务内执行一次性设置指令我们需要在这个 Paperclip 服务内执行两个一次性步骤：

pnpm paperclipai auth bootstrap-ceo — 以创建第一个管理员邀请 URL （应用程序目前显示“Instance setup required”）。
使用我们的订阅验证 Claude Code（设置 CLAUDE_CODE_OAUTH_TOKEN）。我们了解共享集群没有 SSH。请确认：

仪表板的“指令 (Command)”终端是共享集群上执行这些指令的正确/唯一方式吗？
它是在包含应用程序 pnpm/CLI 的实时容器中运行吗？
变更会在重新部署后保留吗？还是管理员邀请需要在每次部署时重新生成？
如果共享集群不支持，是否需要专用服务器 (Dedicated Server) 来执行此操作？

问题 2 — 间歇性 Cloudflare 524 错误公共域名间歇性地返回 524，而 GET / 返回 200，因此源服务器似乎在超过 Cloudflare 约 100 秒的限制后挂起。

容器是否在 4 GB 实例上达到了 OOM / 资源限制？升级到 8 GB 能解决吗？
这是否也可能是导致“指令”终端无法执行我们设置指令的原因？
你们的监控端是否有任何指向原因的信息？

谢谢！

7 条回复

Nnerdai0FREE2026/6/2

错误信息应用界面：“Instance setup required — No instance admin exists yet. Run this command in your Paperclip environment to generate the first admin invite URL: pnpm paperclipai auth bootstrap-ceo”

公共域名间歇性返回 Cloudflare 524 错误（浏览器=正常，Cloudflare=正常，新加坡源站=错误），尽管运行时日志显示 GET / 200： [12:28:46] INFO: GET / 200 [12:28:47] WARN: GET /api/auth/get-session 401 [12:28:47] WARN: GET /api/adapters 403 [12:28:47] WARN: GET /api/companies 403 （401/403 是登录前的预期结果；主要障碍是 524 错误。）

CCanEMPLOYEE2026/6/3

嗨！感谢您提供详细的报告——我深入调查了该服务（paperclip，service-6a1e93028197c9aa0ae2d1c3，腾讯云新加坡共享集群）。调查结果如下：

问题 1 — 执行一次性设置指令

您说得对，这很可能不是资源问题——这几乎肯定是我们目前正在追踪的 Dashboard 网页终端断线错误：浏览器内的终端大约每 2 分钟会中断一次连接，因此指令可能会在执行中途被截断，看起来就像“无法执行”。容器本身运行正常——我刚刚进入容器检查：工作目录为 /app，pnpm 位于 /usr/local/bin/pnpm 的 PATH 中，Node 版本为 v24。

可靠的解决方案是改用 Zeabur CLI 而非 Dashboard 终端来执行——两者使用相同的 kubectl exec 后端，但 CLI 不会受到断线错误的影响：

npx zeabur@latest service exec --id 6a1e93028197c9aa0ae2d1c3 -- pnpm paperclipai auth bootstrap-ceo

关于共享集群（Shared Cluster）的几点重要说明（不支持 SSH——此 exec/终端是官方支持的访问方式）：

它在实时容器内执行，并使用应用程序的 PATH——已如上确认。
容器文件系统是暂时性的——每次重新部署/重启都会被清除。因此：
管理员邀请只有在 Paperclip 将其持久化到 数据库 / 挂载磁盘区 时，才能在重新部署后保留。如果它是写入容器内的本地磁盘，您需要在每次重新部署后重新执行 bootstrap-ceo。
关于 Claude token，请勿在终端中 export CLAUDE_CODE_OAUTH_TOKEN——这只会影响该 Shell，应用程序进程无法看见，且在重新部署后会丢失。请将其设置为 Zeabur 环境变量（服务 → 变量）并重新部署；这样设置会持久保存并注入到应用程序中。
需要专用服务器（Dedicated Server）吗？ 不需要——共享集群可以很好地处理此问题。专用服务器仅在您需要持久化的 SSH/VM 风格环境时才重要。

问题 2 — 间歇性的 Cloudflare 524 错误

根据我目前的观察，这不是 OOM（内存不足）问题，增加到 8 GB 也无法解决：

容器运行时间约 39 小时，没有重启过，内存使用量仅约 214 MB——没有发生 OOM 终止，4 GB 的限制并非瓶颈。
您的日志显示 GET / 200 响应速度很快。524 错误表示 Cloudflare 已连接至源服务器，但在约 100 秒内未收到响应头——这是特定请求挂起，而非整个应用程序崩溃。
顺带一提：有大量的机器人扫描器正在访问 .env 路径（如 /wp/.env、/laravel/.env...）并返回 200——这只是噪音，并非 524 的原因，但您可能需要设置 Cloudflare WAF 规则来封锁它们。

为了进一步厘清问题，能否请您提供：

出现 524 错误的确切路径（总是 /，还是执行长时间工作的 API/AI 路由？）以及最近几次 524 错误的精确时间戳（含时区）。
524 错误是否与执行 AI/代理任务有关——Claude Code 的调用可能会超过 100 秒，这会触发 Cloudflare 的 100 秒限制。

（腾讯云新加坡是我们较新的区域，监控数据较少，因此时间戳有助于我们追踪来源。）

谢谢！

Nnerdai0FREE2026/6/5

我在部署于 Zeabur 的服务上遇到了 502 Bad Gateway 错误。

错误详情

状态：502 Bad Gateway
请求 ID：
URL：https://paperclip-playground.zeabur.app/

可能的原因

服务未监听正确的端口 - 我可以检查 Zeabur 仪表板中的“网络 (Network)”选项卡，查看当前监听的端口。
服务崩溃或停止响应 - 我可以检查“日志 (Logs)”选项卡来调查错误原因。

请协助我根据上述信息排查此 502 错误。

CCanEMPLOYEE2026/6/5

我检查了您的 Paperclip 服务，它目前运行正常且响应正常。日志中最近的所有请求都返回 200，https://paperclip-playground.zeabur.app/ 也返回 200。日志中没有崩溃、重启或 OOM 事件。

之前的 502 错误是暂时性的。在腾讯云新加坡共享集群上，当节点重新调度您的容器（例如在资源重新平衡期间）时，这种情况可能会短暂发生。它通常会在几秒钟到几分钟内自动恢复。

此外，我们刚刚将 Paperclip 模板更新到了最新版本 (v2026.529.0)，其中包含了 7 个版本的改进，包括更好的容器启动、新功能和错误修复。您可以从这里重新部署更新后的模板：https://zeabur.com/templates/E6H44N

您可以再次尝试访问您的服务，并让我知道 502 错误是否仍然存在吗？

Ccy948FREE2026/6/6

您好，请问从 Zeabur 购买的专属服务器 (Dedicated Server) 可以通过 SSH 连接吗？我需要在服务器上进行代码编写。

CCanEMPLOYEE2026/6/6

是的，使用 SSH 端口连接是没有问题的。

AAnonymous2026/6/10

This post has been inactive for a while. We will be closing it in 2 days if there is no new activity.

此问题已被标记为 resolved

resolved 的问题已停用新回复。

论坛

7 条回复

错误详情

可能的原因