Představujeme Husky Hold'em Bench, první verzi OS pokerbotů!
V poslední době jsme v OS viděli spoustu skvělé práce na vyhýbání se LLM ve strategické hratelnosti.
Zde je další zvrat: model si nemůže vybírat své akce přímo, ale místo toho musí implementovat svou politiku v Pythonu za časových a paměťových omezení, která vylučují přístupy hrubou silou a vyhledávací tabulky.
Poté postavíme boty proti sobě ve formátu každý s každým pro 6 hráčů. Jak si vedou některé z předních modelů uvažování?
Představujeme Husky Hold'em Bench, první verzi OS pokerbotů!
V poslední době jsme v OS viděli spoustu skvělé práce na vyhýbání se LLM ve strategické hratelnosti.
Zde je další zvrat: model si nemůže vybírat své akce přímo, ale místo toho musí implementovat svou politiku v Pythonu za časových a paměťových omezení, která vylučují přístupy hrubou silou a vyhledávací tabulky.
Poté postavíme boty proti sobě ve formátu každý s každým pro 6 hráčů. Jak si vedou některé z předních modelů uvažování?
Hermes-4-14B byl vydán!
Náš nejkompaktnější LLM z řady Hermes 4 je lokálně použitelný a optimalizovaný pro spotřebitelský hardware, což poskytuje domácí přístup k výkonnému hybridnímu uvažování a volání nástrojů.
Model je nyní k dispozici na Nous Chat pro online použití a ke stažení na HuggingFace.