DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

We introduceren WorldVQA, een nieuwe benchmark om atomische visie-gecentreerde wereldkennis te meten in Multimodale Grote Taalmodellen. Huidige evaluaties verwarren vaak visuele kennisretrieval met redeneren. In tegenstelling tot dat, ontkoppelt WorldVQA deze capaciteiten om strikt te meten "wat het model heeft gememoriseerd." De benchmark bestaat uit 3.500 VQA-paren verspreid over 9 categorieën, met zorgvuldige aandacht voor linguïstische en culturele diversiteit:

Boven

Positie

Favorieten