D
Dich
@badartandsmart3 подп.
1просмотров
33.3%от подписчиков
22 марта 2026 г.
📷 ФотоScore: 1
🚀 Релиз LongCat-Flash-Prover - это одна из самых сильных open-source моделей для формальной математики. Модель строит и проверяет доказательства как в реальной математике. Внутри • 🧠 Не один агент, а гибрид экспертов - модель генерирует и отбирает лучшие цепочки рассуждений • ⚙️ Алгоритм HisPO - держит длинную логику без развала • 🔍 Жесткая проверка: - Lean4 (формальная математика) - AST-анализ - проверка корректности → галлюцинации почти убраны 📊 Результаты: • 97.1% на MiniF2F (всего 72 попытки) • 41.5% на PutnamBench (очень сложные задачи) Это уже уровень, где open-source начинает догонять топовые research-модели. 📄 Paper: https://github.com/meituan-longcat/LongCat-Flash-Prover/blob/main/LongCat_Flash_Prover_Technical_Report.pdf 📂 GitHub: https://github.com/meituan-longcat/LongCat-Flash-Prover 🤗 Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Prover 🎯Полезные Мл-ресурсы 🚀 Max @data_analysis_ml
1
просмотров
960
символов
Да
эмодзи
Да
медиа

Другие посты @badartandsmart

Все посты канала →
🚀 Релиз LongCat-Flash-Prover - это одна из самых сильных op — @badartandsmart | PostSniper