驚人的速度 在我自己的 GPU 上運行 Claude Code 在家中使用本地模型 > SGLang 服務 MiniMax-M2.1 > 在 8 個 RTX 3090 上 > nvtop 顯示實時 GPU 負載 > Claude Code 生成代碼 + 文檔 > 在我的 AI 集群上端到端運行 MiniMax-M2.1 是我現在最喜歡的本地運行模型