Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

arena.ai
LMArena: Otwarta platforma do benchmarkingu AI opartego na społeczności. Ukończyłam UC Berkeley / lmsysorg. Zatrudniamy: https://t.co/1OkfLq1Pba
🚨 Top 10 otwartych modeli w styczniu: Text Arena
Patrząc wstecz na zeszły miesiąc, oto rankingi według dostawcy na styczeń:
🥇 #1 Kimi-K2.5-Thinking od @Kimi_Moonshot (Zmodyfikowana MIT)
🥈 #2 GLM-4.7 od @Zai_org (MIT)
🥉 #3 Qwen3-235b-a22b-instruct-2507 od @Alibaba_Qwen (Apache 2.0)
W porównaniu do grudnia, rankingi się zmieniły z nowymi wariantami, ale czołowe laboratoria nie uległy zmianie.
Top 5 otwartych modeli ma wszystkie wyniki powyżej 1400. Czy w tym roku zobaczymy nasze pierwsze przełomy na poziomie 1500?
Zobacz więcej szczegółów dotyczących wspinaczy i ruchów w styczniu w wątku 🧵

17
🚨NOWOŚĆ: Kimi K2.5 od @Kimi_Moonshot jest teraz modelem otwartym nr 1 w Code Arena!
W ocenach kodowania agentów w Code Arena, Kimi K2.5 jest teraz:
- modelem otwartym nr 1, przewyższającym GLM-4.7
- nr 5 ogółem, na równi z najlepszymi modelami komercyjnymi, takimi jak Gemini-3-Flash
- jedynym modelem otwartym w pierwszej piątce
🏆Kimi K2.5 jest najlepszym modelem otwartym w kategoriach Tekst, Wizja i Code Arena.
Ogromne gratulacje dla zespołu @Kimi_Moonshot za dalsze przesuwanie granic modeli otwartych 👏


Kimi.ai27 sty 2026
🥝 Poznaj Kimi K2.5, otwartoźródłową wizualną inteligencję agentową.
🔹 Globalne SOTA w benchmarkach agentowych: pełny zestaw HLE (50,2%), BrowseComp (74,9%)
🔹 Otwartoźródłowe SOTA w wizji i kodowaniu: MMMU Pro (78,5%), VideoMMMU (86,6%), zweryfikowane SWE-bench (76,8%)
🔹 Koduj z wyczuciem: przekształcaj czaty, obrazy i filmy w estetyczne strony internetowe z ekspresyjnym ruchem.
🔹 Agent Swarm (Beta): samodzielnie kierowane agenty pracujące równolegle, na dużą skalę. Do 100 sub-agentów, 1 500 wywołań narzędzi, 4,5× szybciej w porównaniu do konfiguracji z jednym agentem.
-
🥝 K2.5 jest teraz dostępny w trybie czatu i trybie agenta.
🥝 K2.5 Agent Swarm w wersji beta dla użytkowników z wyższej półki.
🥝 Do kodowania na poziomie produkcyjnym możesz połączyć K2.5 z Kimi Code:
-
🔗 API:
🔗 Blog technologiczny:
🔗 Wagi i kod:

90
🚨NOWOŚĆ: Kimi K2.5 Thinking od @Kimi_Moonshot to model otwarty nr 1 w Vision Arena!
Najważniejsze:
- model otwarty nr 1 w Vision (+40 pkt przewagi nad następnym modelem otwartym)
- nr 6 w ogólnym rankingu (Qwen3-vl-235b-a22b-instruct jest następnym modelem otwartym na miejscu nr 18)
To jedyny model otwarty w Top 15. Gratulacje dla zespołu @Kimi_Moonshot za to niesamowite osiągnięcie! 👏


Kimi.ai27 sty 2026
🥝 Poznaj Kimi K2.5, otwartoźródłową wizualną inteligencję agentową.
🔹 Globalne SOTA w benchmarkach agentowych: pełny zestaw HLE (50,2%), BrowseComp (74,9%)
🔹 Otwartoźródłowe SOTA w wizji i kodowaniu: MMMU Pro (78,5%), VideoMMMU (86,6%), zweryfikowane SWE-bench (76,8%)
🔹 Koduj z wyczuciem: przekształcaj czaty, obrazy i filmy w estetyczne strony internetowe z ekspresyjnym ruchem.
🔹 Agent Swarm (Beta): samodzielnie kierowane agenty pracujące równolegle, na dużą skalę. Do 100 sub-agentów, 1 500 wywołań narzędzi, 4,5× szybciej w porównaniu do konfiguracji z jednym agentem.
-
🥝 K2.5 jest teraz dostępny w trybie czatu i trybie agenta.
🥝 K2.5 Agent Swarm w wersji beta dla użytkowników z wyższej półki.
🥝 Do kodowania na poziomie produkcyjnym możesz połączyć K2.5 z Kimi Code:
-
🔗 API:
🔗 Blog technologiczny:
🔗 Wagi i kod:

161
Najlepsze
Ranking
Ulubione
