惊人的速度 在我自己的家用GPU上运行Claude Code与本地模型 > SGLang服务MiniMax-M2.1 > 在8个RTX 3090上 > nvtop显示实时GPU负载 > Claude Code生成代码 + 文档 > 在我的AI集群上端到端 MiniMax-M2.1是我现在最喜欢的本地运行模型