現代のLLMはコードを書くのは得意ですが、ポリシーの最適化には必ずしも向いていません。しかし、LLMを進化的枠組みで包み込み、ポリシーを検索することは可能です。新しい@the_nof1論文では、強力な取引政策を自動的に生成できることを示しています。