26просмотров
26.8%от подписчиков
26 сентября 2025 г.
📷 ФотоScore: 29
🤖OpenAI представила GDPval — бенчмарк для оценки экономического влияния ИИ OpenAI разработала GDPval — бенчмарк для измерения реального влияния искусственного интеллекта на экономику. В отличие от традиционных тестов, таких как MMLU, которые оценивают знания на основе коротких вопросов, GDPval фокусируется на выполнении практических рабочих задач, соответствующих реальным профессиональным обязанностям. Бенчмарк включает 1 320 заданий, охватывающих 44 профессии в девяти отраслях, которые в совокупности формируют более 5% ВВП США. К ним относятся: юриспруденция, финансы, инженерия, здравоохранение, консалтинг, образование, управление проектами, маркетинг и администрирование. Задачи разработаны практиками с средним стажем 14 лет. Формат соответствует реальным рабочим сценариям:
— написание правовой записки,
— доработка технического чертежа,
— подготовка аналитической таблицы или презентации,
— составление отчета по финансовым данным. Оценка качества выполнения проводится методом слепого сравнения: решения, созданные ИИ и профессионалами, оцениваются экспертами по единым критериям без указания источника. Первые результаты показали, что среди протестированных моделей лучшие результаты показали:
— Claude Opus 4.1 — по общему качеству и оформлению,
— GPT-5 — по точности и глубине анализа. Обе модели приблизились к качеству решений, предоставляемых профессионалами, в ряде задач. OpenAI отмечает, что в отдельных случаях ИИ способен выполнять задачи в десятки раз быстрее и с меньшими затратами, чем человек. GDPval предназначен для использования компаниями и разработчиками как инструмент для оценки потенциала автоматизации в различных профессиональных сферах. Цель — определить, какие задачи и профессии могут быть наиболее эффективно трансформированы за счет внедрения ИИ. 🔍 Вывод:
GDPval — первый систематизированный инструмент, который измеряет не потенциал ИИ, а его реальную производительность в рабочих процессах, формирующих экономику.
Он показывает, какой ИИ полезнее и уже становится ясно — ИИ не просто помогает.
Он меняет структуру труда — и те, кто начнёт использовать его как стандартный инструмент, получат решающее преимущество. #НейроТочка #ИИ #НовостиИИ #экономика #GDPval #OpenAI #автоматизация @nejrotochka 🤖 НейроТочка в ВК