Los agentes de codificación luchan con trabajos complejos en repositorios grandes y desordenados, y esto no mejorará hasta que dejemos de usar benchmarks saturados con pruebas que no se parecen en nada a la ingeniería real. ¡Por eso estamos comprometidos a invertir $1M en cline-bench, nuestro benchmark abierto para tareas de codificación del mundo real!