Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
scoprire quale oggetto mancasse si è rivelato impossibile per tutti i llms, mentre è stato piuttosto banale per gli esseri umani.

nel complesso ho trovato il pensiero di gpt-5 molto utile per alcune domande molto specifiche che avevo su silksong. Ho visto molte meno allucinazioni rispetto a quando usavo o3 mentre giocavo a blue prince.
claude e gemini hanno fallito completamente, grok ha pensato per un po' e ha dato risposte insensate (entrambi gli elementi menzionati possono essere visti nell'immagine).

aggiornamento: gpt-5 pro ha effettivamente risolto questo correttamente. Sono impressionato. Il modello di pensiero ha sbagliato ogni volta.

6,12K
Principali
Ranking
Preferiti