A Microsoft acabou com a máfia 🤯 das GPUs Eles finalmente tornaram open source seu framework de inferência de LLM de 1 bit chamado bitnet.cpp. Ele permite rodar modelos de 100B parâmetros no seu processador local sem GPUs. - Inferência 6,17x mais rápida - 82,2% menos energia nas CPUs 100% código aberto.