@Baidu_IncのERNIE-5.0-Preview-1203はLMArenaのテキストベンチマークで1451点を獲得し、中国モデルの中で#1位を獲得しました。 前回のリリースから+23分の上昇であり、次期中国モデル(Qwen3-maxプレビュー#22)との差は大きいです。 創作や複雑で多段階のプロンプトの扱いにおいて際立っており、コンテンツパイプラインを構築したり、微妙な指示フローを扱う際に大きな影響を与えます。 結果を自分の👇目で確かめてください