C
commit history
@c0mmit4.1K подп.
3.5Kпросмотров
86.4%от подписчиков
27 октября 2025 г.
Score: 3.9K
Последние месяцы заметно вырос интерес к средам обучения с подкреплением (RL environments) и к сбору проверяемых задач. Вот например, заметка в TechCrunch про рост инетереса. Одна из проблем масштабирования таких задач — у каждого датасета и бенчмарка свой репозиторий с кодом оценки и свой формат. Чтобы запустить агента на любом бенчмарке, приходится разбираться в скриптах, вносить правки и писать адаптеры. У terminal-bench как раз есть единый удобный формат и готовые адаптеры для популярных наборов задач. Подробности – в разборе Макса, который я репостнул. Вообще, я рекомендую канал Макса. Он тоже живёт в Лондоне, занимается кодовыми агентами + у него есть пара постов про собесы в фаанги на ml позиции: какие задают вопросы и какие диапазоны офферов.
3.5K
просмотров
763
символов
Нет
эмодзи
Нет
медиа

Другие посты @c0mmit

Все посты канала →
Последние месяцы заметно вырос интерес к средам обучения с п — @c0mmit | PostSniper