L'un des éléments novateurs de l'architecture de Pi0 est l'utilisation d'une tête d'action de correspondance de flux -- avant cela, les VLA modernes comme OpenVLA utilisaient des têtes de diffusion de diffusion. Qu'est-ce qu'une tête de correspondance de flux ? Qu'est-ce qui la rend plus facile à utiliser par rapport à d'autres têtes de débruitage ? Un court fil !🧵 (1/7)