Code IT
AI та Deep Learning

Claude Opus 4.6: що нового в найрозумнішій моделі Anthropic

Олександр Ковальчук
Олександр Ковальчук
Опубліковано: Оновлено: 👁 30 переглядів

Як Opus 4.6 показав себе на тестах

Opus 4.6 краще продумує складні задачі, вільніше орієнтується у великих кодових базах і точніше ловить власні помилки під час рев’ю та дебагінгу. На Terminal-Bench 2.0 – тесті, де AI самостійно пише й виконує код – Opus 4.6 набрав найвищий бал серед усіх конкурентів.

У робочих задачах із фінансів, права та інших сфер (бенчмарк GDPval-AA) Opus 4.6 обходить GPT-5.2 від OpenAI приблизно у 70% випадків. Свого попередника Opus 4.5 та конкурентів у пошукових задачах (BrowseComp) нова модель випереджає із ще більшим відривом.

Команда AI-агентів і контекст на цілу бібліотеку

У Claude Code вперше з’явилися командні агенти – поки що в тестовому режимі. Кілька AI-агентів можуть паралельно працювати над одним проєктом: наприклад, разом рев’юїти великий репозиторій, де кожен бере свою частину.

Щоб охопити справді масивні проєкти, Opus 4.6 отримав контекстне вікно на 1 млн токенів (у бета-режимі) – вперше для класу Opus. Для порівняння: це приблизно 7–8 середніх книжок або десятки тисяч рядків коду. Вивід теж зріс – до 128 тисяч токенів за запит, що вистачить на відповідь розміром із невеликий роман.

Що ще нового і скільки коштує

Anthropic окремо наголошує на кіберзахисті. Компанія вже задіяла Opus 4.6 для пошуку та виправлення вразливостей у програмах з відкритим кодом. Для контролю ризиків розробили шість нових зондів, що відстежують потенційно небезпечні відповіді.

З офісними задачами теж є зрушення: покращили підтримку Excel та додали PowerPoint. Усе це об’єднує Cowork – середовище для автономної роботи з документами, розраховане навіть на тих, хто ніколи не писав код.

Для розробників ціна API не змінилась: $5 за мільйон вхідних токенів і $25 за вихідні. Звичайні користувачі можуть спробувати Opus 4.6 через підписку Pro ($17/міс) або Max (від $100/міс). Актуальні тарифи – на офіційному сайті Claude.

Читайте також

AI та Deep Learning

Anthropic запустила Code Review: AI-агенти шукають баги до релізу

9 березня Anthropic представила Code Review – новий інструмент у Claude Code, який автоматично перевіряє pull request (PR) – запити на додавання змін до проєкту. Кілька AI-агентів паралельно аналізують PR і виявляють баги ще до того, як код потрапить у продакшн.