مبروك لفريق @Alibaba_Qwen على Qwen3-TTS! 🎉
vLLM-Omni جاهز بدعم اليوم الأول – استنساخ الصوت، تصميم الصوت، والتحكم في اللغة الطبيعية للعواطف والعروض، وكل ذلك يعمل بشكل أصلي.
الاستدلال غير المتصل متاح الآن عبر PR #895، والخدمة الإلكترونية قريبا.
🔗
Qwen3-TTS أصبح رسميا متاحا. قمنا بفتح مصادر العائلة الكاملة—VoiceDesign، CustomVoice، وBase—مما جلب جودة عالية للمجتمع المفتوح.
- 5 طرازات (0.6B و 1.8B)
- تصميم الصوت الحر والاستنساخ
- دعم لعشر لغات
- توكنازر SOTA 12Hz للضغط العالي
- دعم كامل للضبط الدقيق
- أداء SOTA
نعتقد أن هذا ربما أكثر إصدار أحدث تغيير في عالم TTS مفتوح المصدر حتى الآن. تفضل، اكسر اللعبة وابني شيئا رائعا. 🚀 كل شيء الآن — الأوزان، الشيفرة، والورق. استمتع. 🧵
Github:
وجه العناق:
ModelScope:
المدونة:
الورقة:
عرض وجه العناق:
عرض ModelScope:
واجهة برمجة التطبيقات (API):
دعم Day-0 ل GLM-4.7-Flash متوفر الآن في vLLM! 🚀
معيار جديد لفئة 30B—فعال، خفيف، وقوي للبرمجة والوكلاء.
وأيضا ممتاز للكتابة الإبداعية، والترجمة، والمهام طويلة السياق.
العلاقات العامة:
عندما أضفنا دعم gpt-oss، لم يكن لدى واجهة برمجة تطبيقات الاستجابات معيار، وقمنا فعليا بعكس هندسة البروتوكول عن طريق التكرار والتخمين بناء على السلوك. نحن متحمسون جدا لمواصفات Open Responses: بدائيات نظيفة، أدوات أفضل، اتساق للفوز!
اليوم نعلن عن Open Responses: مواصفة مفتوحة المصدر لبناء واجهات LLM متعددة المزودين وقابلة للتشغيل البيني، مبنية فوق واجهة OpenAI Responses الأصلية.
✅ متعدد المزودين بشكل افتراضي
✅ مفيد لسير العمل في العالم الحقيقي
✅ قابل للتوسعة دون تجزئة
ابن أنظمة وكلاء دون إعادة كتابة التكديس لكل نموذج: