Files
vps-management-bot/memory/2026-02-28.md
2026-03-21 01:10:53 +08:00

4.5 KiB
Raw Blame History

2026-02-28

DStatus 探针恢复(重大事故)

  • 原因: 批量设置 billing 时 payload 只含 name+data.billing+expire_time覆盖了 data.api 和 data.ssh
  • 影响: 27个节点的 API key 和 SSH host 全部丢失,探针掉线
  • 修复: SSH到每台服务器读取 /etc/dstatus-agent/config.yaml 中的 key写回 DStatus 后台
  • 恢复方式: postjson('/admin/servers/{sid}/edit', {name, data:{...existing, api:{mode:true, key, port:9999}}, ...})
  • 已恢复 28/30 节点(含 Mac mini/P320 未受影响的3个 = 实际修复25个
  • 未恢复: BGP.GD IX NAT (161.248.136.88, SSH超时) | HALO (178.253.245.179, 密码不对)
  • 面板状态: 23在线 / 7离线部分可能是探针本身离线非本次事故
  • 教训: 编辑 DStatus 节点时必须先读取完整 server 对象再修改,不能只提交部分字段

DStatus 卸载 & 哪吒探针部署

  • DStatus 主控 (OVH097 51.81.222.43) 已卸载: dstatus+watchtower容器+nginx反代+镜像全删
  • Mac mini DStatus 探针已卸载: launchd服务+二进制+配置全删
  • 哪吒面板 v2.0.4 部署在 OVH097 (51.81.222.43), Docker, 端口8008
  • 面板地址: https://mjjvps.com | admin / fJ7#vP9s@tL2qX!d
  • Nginx 反代: SSL+WebSocket+gRPC, certbot证书(之前DStatus的)
  • Agent secret: d1frPCGfCp2MF41P7aTFc3lRBQ59T9zX
  • OVH097 正确IP: 51.81.222.43 (不是DStatus里的51.77.249.97)

已装探针节点 (15台)

ID 名称 IP 备注
1 NG 102.207.41.184 脚本安装(旧探针自动注册)
2 QHIX 202.8.106.233 脚本安装
3 SVYUN 103.236.66.167 脚本安装(先装unzip)
4 alice 91.103.122.138 脚本安装
5 BGP.GD IEPL 31.57.248.148 脚本安装
6 YT.NET 103.236.59.173 手动创建systemd服务
7 TXBGP 31.56.66.177 通过IEPL中转(119.147.22.12:18008→8008)
8 Turin 103.73.220.84 旧探针自动注册
9 HDY 38.76.204.161 旧探针自动注册
10 Tarek 155.103.66.237 旧探针自动注册
11 Gerren 173.249.215.67 旧探针自动注册
12 Green.SJC 173.249.199.16 旧探针自动注册
13 BWH.SG 45.135.41.24 旧探针自动注册
14 CTC 104.251.236.249 旧探针自动注册
15 BGP.GD IX NAT 31.56.66.177 从YT.NET跳板传文件+手动服务

踩坑

  • BGP.GD IX NAT 和 TXBGP UUID冲突: 复制agent时带了相同UUID面板只认一台需换新UUID
  • TXBGP 443/80出站不通: 腾讯云屏蔽境外443/808008直连通但gRPC不稳定
  • TXBGP 解决方案: BGP.GD IEPL上socat中转(nezha-relay.service, 18008→51.81.222.43:8008)
  • TXBGP agent自更新卡死: .stat锁文件+连不上GitHub需disable_auto_update+disable_force_update
  • 国内机器装探针: GitHub下不了需从已装机器传二进制或用已有旧版agent
  • YT.NET agent版本1.15.0(旧): 手动创建systemd服务可用

测试机 terminalpub 模型修复

  • provider名字要用 terminal 不是 terminalpub
  • baseUrl: https://terminal.pub | api: anthropic-messages
  • 测试机(155.103.66.237) 已添加 terminal provider

TXBGP 中转方案变更

  • 用户要求去掉 IEPL 跳板中转
  • TXBGP 改回直连 51.81.222.43:8008 (tls:false)
  • IEPL 上 nezha-relay.service 已删除
  • TXBGP 直连 8008 不太稳定(gRPC DeadlineExceeded),但用户接受

哪吒面板自定义背景(多轮调试)

  • 背景图: 雪山风光, 原图2730x1535 PNG→678KB JPG(质量95%), 放在 /var/www/nezha/bg.jpg
  • Nginx 加了 /static/ 路径指向 /var/www/nezha/
  • 面板名称: 小白探针 | 语言: zh_TW
  • 最终CSS: 白色半透明卡片 rgba(255,255,255,0.35) + blur(0px) + 雪山背景
  • 选择器: .rounded-lg.border.bg-card (只改服务器卡片,不影响概览区按钮)
  • 踩坑: CSS里双引号([class*="bg-card"])会跟YAML双引号冲突→面板崩502
  • 踩坑: yaml.dump会搞乱cover字段类型(uint8)→面板启动失败
  • 踩坑: 图片压缩太狠(1920px/85%)会糊→用原始分辨率+95%质量
  • 安全写法: 直接echo追加到config.yamlCSS里避免双引号用[class*=bg-card]
  • 参考: 用户转发了"可樂"的哪吒面板自定义代码(iOS玻璃风格)

哪吒探针节点补充

  • TXBGP agent版本1.15.0太旧→从Mac mini传2.0.1二进制
  • TXBGP .stat锁文件卡自更新→需disable_auto_update+disable_force_update
  • TXBGP 443/80出站不通(腾讯云)→直连8008(tls:false), 不用中转
  • BGP.GD IX NAT UUID冲突(跟TXBGP相同)→换新UUID后上线(ID15)
  • 面板15台全部在线并改名完成
  • HDY(ID9)/Tarek(ID10)/Gerren(ID11)/Green.SJC(ID12)/BWH.SG(ID13)/CTC(ID14) 旧探针自动注册