Představujeme Husky Hold'em Bench, první verzi OS pokerbotů! V poslední době jsme v OS viděli spoustu skvělé práce na vyhýbání se LLM ve strategické hratelnosti. Zde je další zvrat: model si nemůže vybírat své akce přímo, ale místo toho musí implementovat svou politiku v Pythonu za časových a paměťových omezení, která vylučují přístupy hrubou silou a vyhledávací tabulky. Poté postavíme boty proti sobě ve formátu každý s každým pro 6 hráčů. Jak si vedou některé z předních modelů uvažování?
285