数値の乗算は以前は LLM の課題でしたが、現在ではほぼ解決されています。このコンテストでは、すべての主流モデルでグリッド検索を実行したところ、gpt-oss-120b が際立っており、18 桁 * 18 桁の乗算で ~93% の正解を獲得しました。頭がおかしい! 例:364826485628193748 * 492816485726395817 = ...