|

Новая нейросеть Opus 4.5 обошла GPT-5.1 сразу в нескольких тестах

Anthropic представила обновлённую версию своей флагманской языковой модели — Opus 4.5. Новинка стала заметно сильнее прежней и уже успела обойти GPT-5.1 в ряде ключевых бенчмарков. Кроме того, модель теперь экономичнее и дешевле в использовании.

Opus 4.5 стала лучшей в тестах SWE-bench Verified, связанных с разработкой ПО, а также заняла первое место в SWE-bench Multilingual — испытании по созданию кода на семи из восьми языков программирования. Модель также вышла в лидеры среди ИИ, оцениваемых как автономные агенты.

Среди достоинств разработчики отмечают улучшенную креативность, высокую устойчивость к промпт-инъекциям, более экономный расход токенов и новый параметр effort, отвечающий за глубину рассуждений ИИ.

По сравнению с Claude Sonnet 4.5, новая Opus потребляет на 76% меньше токенов при сохранении тех же функций и аналогичном уровне effort. Также снижена стоимость: $5 за миллион входящих токенов и $25 за миллион исходящих, тогда как Sonnet стоит $15 и $75 соответственно.

Испробовать Opus 4.5 уже можно в фирменных приложениях Anthropic и через API.

Поделиться:

Интересные

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *