Nous introduisons WorldVQA, une nouvelle référence pour mesurer les connaissances mondiales centrées sur la vision atomique dans les Modèles de Langage Multimodaux de Grande Taille. Les évaluations actuelles confondent souvent la récupération de connaissances visuelles avec le raisonnement. En revanche, WorldVQA découple ces capacités pour mesurer strictement "ce que le modèle mémorise." La référence se compose de 3 500 paires VQA réparties sur 9 catégories, avec une attention particulière à la diversité linguistique et culturelle :