Wir stellen Pocket-TTS vor, das erste TTS-Modell, das in Echtzeit auf der CPU (!) mit hochauflösendem Sprachklonen läuft. Basierend auf Continuous Audio Language, der neuesten Welle von audio-generativen Modellen von Kyutai. Unter der Leitung von Gradiums CSO @honualx, der die Audioforschung bei Kyutai weiterhin anführt, treibt das Labor die Grenzen der Forschung im Einklang mit Gradiums Produkten voran.