Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
💡 Ведущие провайдеры вывода данных — @basetenco, @DeepInfra, @FireworksAI_HQ и @togethercompute — снижают стоимость за токен до 10 раз в различных отраслях с помощью оптимизированных стеков вывода, работающих на платформе NVIDIA Blackwell.
Объединив #opensource переднюю разведывательную информацию с аппаратно-программным дизайном NVIDIA Blackwell и своими собственными оптимизированными стеками вывода, эти провайдеры обеспечивают резкое снижение стоимости токенов для таких компаний, как @SullyAI, Latitude, Sentient и Decagon.
🔗

⚡ На базе NVIDIA Blackwell, @togethercompute и @DecagonAI ускоряют обслуживание клиентов с помощью ИИ — обеспечивая взаимодействие с голосом, похожим на человеческий, за менее чем 600 мс и сокращая затраты в 6 раз.
С оптимизированным стеком вывода Together, работающим на NVIDIA Blackwell, Decagon обеспечивает масштабируемые консьерж-услуги в реальном времени — обрабатывая сотни запросов в секунду с точностью менее секунды.
🩺 @SullyAI трансформирует эффективность здравоохранения с помощью Model API от Baseten, запускающего передовые открытые модели, такие как gpt-oss-120b на графических процессорах NVIDIA Blackwell.
С их оптимизированным стеком вывода, построенным с использованием NVIDIA Blackwell, NVFP4, TensorRT-LLM и NVIDIA Dynamo, Baseten обеспечил снижение затрат в 10 раз и на 65% более быстрые ответы для ключевых рабочих процессов, таких как генерация клинических заметок.
@basetenco @DeepInfra @FireworksAI_HQ @togethercompute @DecagonAI @sullyai ⚙️ Latitude запускает модели большого масштаба с использованием смеси экспертов на платформе вывода DeepInfra, работающей на GPU NVIDIA Blackwell, NVFP4 и TensorRT LLM.
DeepInfra снизила стоимость за миллион токенов с $0.20 до $0.05 — прирост эффективности в 4 раза.
Чтобы управлять масштабом и сложностью, @SentientAGI использует платформу вывода Fireworks AI, работающую на NVIDIA Blackwell. С оптимизированным стеком вывода Blackwell от @FireworksAI_HQ, Sentient достигла 25-50% лучшей стоимости по сравнению с предыдущей разверткой на базе Hopper.
Другими словами, компания могла обслуживать на 25–50% больше одновременных пользователей на каждом GPU за ту же стоимость. Масштабируемость платформы поддержала вирусный запуск 1,8 миллиона пользователей в списке ожидания за 24 часа и обработала 5,6 миллиона запросов за одну неделю, обеспечивая при этом стабильную низкую задержку.
112
Топ
Рейтинг
Избранное
