Opus 4.6 是世界上最強大的電子表格模型 我們與 @AnthropicAI 合作,對 Opus 4.6 在最困難的 Excel 工作上進行基準測試 需要專家花費數小時的任務,與 Opus 4.5 相比,得分提升了約 20-30% 在 @tryshortcut 上,現在大多數工作都感覺已經解決,只需幾個很棒的提示
@AnthropicAI @tryshortcut 我真的無法在測試 Opus 4.6 之後入睡。 硬著陸的開始已經有一段時間了
408