عندما لا يرغب الأشخاص في استخدام عمليات إكمال الدردشة لطرح RL ، أشعر بالارتباك الشديد قبل الميلاد مثل كيف كنت تخطط لاستنتاج النموذج لأي شيء مفيد بعد تدريبه؟ أم أنك لم تكن تخطط للقيام بذلك؟
@ellev3n11 الإكمال + apply_chat_template هو في الأساس نفس الشيء الذي تفعله محركات الاستدلال تحت غطاء المحرك على أي حال :) أجد أنه من الملائم جدا أن أكون قادرا على إنشاء / تقييم بيئة التشغيل باستخدام نماذج واجهة برمجة التطبيقات التعسفية ، على الرغم من أن إكمال الدردشة يبسط ذلك كثيرا
‏‎15.71‏K