Стиснення моделей за допомогою ШІ вперше зробило ончейн-інференцію економічно вигідною. Раніше запуск моделі параметрів 7B коштував $2-3 за виведення з урахуванням газових плат і накладних витрат. Ця ціна робить будь-який AI-додаток, орієнтований на споживача, «мертвим» з самого початку. Ви не можете створити чат-бота, який коштуватиме користувачам $2 за повідомлення. Економіка ніколи не працювала. Техніки квантування та обрізання стискають моделі до параметрів 1-2B без значної втрати точності. Раптово вартість виведення знижується до $0.10-0.20 за дзвінок. Все ще не безкоштовно, але тепер ви в діапазоні, де моделі мікроплатежів стають життєздатними. Користувачі можуть платити частки цента за взаємодію, розробники можуть покривати витрати без венчурних субсидій, а економіка одиниць фактично закривається. Коли inference стає достатньо дешевим для підтримки реальних додатків, а не лише демонстрацій, ви відкриваєте зовсім інший простір дизайну. AI-агенти, які працюють повністю в блокчейні, безперервно взаємодіють з користувачами і не потребують централізованих API-залежностей. Саме тоді DeAI перестає бути дослідницьким проєктом і стає інфраструктурою. Дивись 0G.