Новая нейросеть Opus 4.5 обошла GPT-5.1 сразу в нескольких тестах
Anthropic представила обновлённую версию своей флагманской языковой модели — Opus 4.5. Новинка стала заметно сильнее прежней и уже успела обойти GPT-5.1 в ряде ключевых бенчмарков. Кроме того, модель теперь экономичнее и дешевле в использовании.
Opus 4.5 стала лучшей в тестах SWE-bench Verified, связанных с разработкой ПО, а также заняла первое место в SWE-bench Multilingual — испытании по созданию кода на семи из восьми языков программирования. Модель также вышла в лидеры среди ИИ, оцениваемых как автономные агенты.
Среди достоинств разработчики отмечают улучшенную креативность, высокую устойчивость к промпт-инъекциям, более экономный расход токенов и новый параметр effort, отвечающий за глубину рассуждений ИИ.
По сравнению с Claude Sonnet 4.5, новая Opus потребляет на 76% меньше токенов при сохранении тех же функций и аналогичном уровне effort. Также снижена стоимость: $5 за миллион входящих токенов и $25 за миллион исходящих, тогда как Sonnet стоит $15 и $75 соответственно.
Испробовать Opus 4.5 уже можно в фирменных приложениях Anthropic и через API.
