Microsoft acabó con la mafia de las GPU 🤯 Finalmente han abierto su marco de inferencia LLM de 1 bit llamado bitnet.cpp. Te permite ejecutar modelos de 100B parámetros en tu CPU local sin GPUs. - Inferencia 6.17x más rápida - 82.2% menos energía en CPUs 100% Código Abierto.