Claude Opus 4.6: що нового в найрозумнішій моделі Anthropic

Як Opus 4.6 показав себе на тестах
Opus 4.6 краще продумує складні задачі, вільніше орієнтується у великих кодових базах і точніше ловить власні помилки під час рев’ю та дебагінгу. На Terminal-Bench 2.0 – тесті, де AI самостійно пише й виконує код – Opus 4.6 набрав найвищий бал серед усіх конкурентів.
У робочих задачах із фінансів, права та інших сфер (бенчмарк GDPval-AA) Opus 4.6 обходить GPT-5.2 від OpenAI приблизно у 70% випадків. Свого попередника Opus 4.5 та конкурентів у пошукових задачах (BrowseComp) нова модель випереджає із ще більшим відривом.
Команда AI-агентів і контекст на цілу бібліотеку
У Claude Code вперше з’явилися командні агенти – поки що в тестовому режимі. Кілька AI-агентів можуть паралельно працювати над одним проєктом: наприклад, разом рев’юїти великий репозиторій, де кожен бере свою частину.
Щоб охопити справді масивні проєкти, Opus 4.6 отримав контекстне вікно на 1 млн токенів (у бета-режимі) – вперше для класу Opus. Для порівняння: це приблизно 7–8 середніх книжок або десятки тисяч рядків коду. Вивід теж зріс – до 128 тисяч токенів за запит, що вистачить на відповідь розміром із невеликий роман.
Що ще нового і скільки коштує
Anthropic окремо наголошує на кіберзахисті. Компанія вже задіяла Opus 4.6 для пошуку та виправлення вразливостей у програмах з відкритим кодом. Для контролю ризиків розробили шість нових зондів, що відстежують потенційно небезпечні відповіді.
З офісними задачами теж є зрушення: покращили підтримку Excel та додали PowerPoint. Усе це об’єднує Cowork – середовище для автономної роботи з документами, розраховане навіть на тих, хто ніколи не писав код.
Для розробників ціна API не змінилась: $5 за мільйон вхідних токенів і $25 за вихідні. Звичайні користувачі можуть спробувати Opus 4.6 через підписку Pro ($17/міс) або Max (від $100/міс). Актуальні тарифи – на офіційному сайті Claude.
