Anthropic запустила Code Review: AI-агенти шукають баги до релізу

Яку проблему вирішує Code Review

Code review – це стандартний етап розробки, коли колеги перевіряють чужий код перед тим, як він стане частиною проєкту. Зазвичай це робить людина, але коли змін стає більше – ревʼю не встигає за розробкою.

За даними Anthropic, кожен інженер компанії став писати на 200% більше коду, ніж рік тому – здебільшого завдяки AI-генерації. Кількість PR зросла, а якість їхньої перевірки впала. До запуску Code Review всередині компанії лише 16% PR отримували змістовні зауваження, а після цього показник піднявся до 54%.

Як команда AI-агентів перевіряє pull request

Code Review інтегрується з GitHub і після активації запускається автоматично при кожному PR. Система побудована на багатоагентній архітектурі: кілька агентів одночасно шукають баги, верифікують знахідки та ранжують їх за серйозністю. Окремий агент збирає все докупи й прибирає дублікати.

Масштаб роботи залежить від обсягу змін: для складних PR залучається більше агентів, для дрібних – вистачає швидкого огляду. Середній час на один PR – близько 20 хвилин. Фокус – саме на помилках у логіці, а не на стилі коду. Серйозність позначається кольорами: червоний – критичні помилки, жовтий – потенційні проблеми, фіолетовий – баги, що вже були в коді до цього PR. Для глибшого аудиту безпеки існує окремий продукт – Claude Code Security.

Що показали місяці тестування всередині Anthropic

Компанія тестувала Code Review на власних репозиторіях протягом кількох місяців. У великих PR (понад 1000 змінених рядків) інструмент фіксував баги у 84% випадків – у середньому 7,5 на один PR. Навіть у дрібних PR (до 50 рядків) – у кожному третьому. При цьому менше 1% зауважень інженери визнали хибними – тобто система майже не помиляється.

В одному з кейсів маленька правка у продакшн-сервісі виглядала рутинною і зазвичай отримала б швидке схвалення. Але Code Review класифікував її як критичну – зміна зламала б автентифікацію. Розробник потім зізнався, що сам не помітив би цього.

Схожу ефективність підтвердила команда TrueNAS: під час рефакторингу модуля шифрування Code Review знайшов старий баг у коді, який PR безпосередньо не змінював. Дефект тихо очищав кеш криптографічних ключів при кожній синхронізації – знайти таке вручну під час ревʼю майже неможливо.

Скільки коштує і хто вже може спробувати Code Review

Code Review – платний інструмент, ціна якого не входить у підписку. Середня вартість аналізу одного PR – $15–25 залежно від розміру та складності. Наразі він доступний у режимі research preview для підписників Team та Enterprise. Адміністратори можуть встановити місячний ліміт витрат на організацію, увімкнути перевірку лише для обраних репозиторіїв і відстежувати статистику через аналітичну панель. Code Review не схвалює PR самостійно – остаточне рішення залишається за людиною.

Anthropic запустила Code Review: AI-агенти шукають баги до релізу

Яку проблему вирішує Code Review

Як команда AI-агентів перевіряє pull request

Що показали місяці тестування всередині Anthropic

Скільки коштує і хто вже може спробувати Code Review

Читайте також

Claude Opus 4.6: що нового в найрозумнішій моделі Anthropic