Microsoft acabó con la mafia 🤯 de las GPU Finalmente, abrieron su framework de inferencia LLM de 1 bit llamado bitnet.cpp. Te permite ejecutar modelos de 100B de parámetros en tu CPU local sin GPUs. - Inferencia 6,17x más rápida - 82,2% menos de energía en CPUs 100% de código abierto.