Opus 4.6 是世界上最强大的电子表格模型 我们与 @AnthropicAI 合作,对 Opus 4.6 在最困难的 Excel 工作上进行了基准测试 需要专家花费数小时的任务,与 Opus 4.5 相比,得分提升了 ~20-30% 在 @tryshortcut 上,大部分工作现在感觉已经解决,只需几个很好的提示
@AnthropicAI @tryshortcut 我真的无法在测试 Opus 4.6 后入睡。 硬着陆早在一段时间前就开始了
415