Anthropic запустила Code Review: AI-агенти шукають баги до релізу

Яку проблему вирішує Code Review
Code review – це стандартний етап розробки, коли колеги перевіряють чужий код перед тим, як він стане частиною проєкту. Зазвичай це робить людина, але коли змін стає більше – ревʼю не встигає за розробкою.
За даними Anthropic, кожен інженер компанії став писати на 200% більше коду, ніж рік тому – здебільшого завдяки AI-генерації. Кількість PR зросла, а якість їхньої перевірки впала. До запуску Code Review всередині компанії лише 16% PR отримували змістовні зауваження, а після цього показник піднявся до 54%.
Як команда AI-агентів перевіряє pull request
Code Review інтегрується з GitHub і після активації запускається автоматично при кожному PR. Система побудована на багатоагентній архітектурі: кілька агентів одночасно шукають баги, верифікують знахідки та ранжують їх за серйозністю. Окремий агент збирає все докупи й прибирає дублікати.
Масштаб роботи залежить від обсягу змін: для складних PR залучається більше агентів, для дрібних – вистачає швидкого огляду. Середній час на один PR – близько 20 хвилин. Фокус – саме на помилках у логіці, а не на стилі коду. Серйозність позначається кольорами: червоний – критичні помилки, жовтий – потенційні проблеми, фіолетовий – баги, що вже були в коді до цього PR. Для глибшого аудиту безпеки існує окремий продукт – Claude Code Security.
Що показали місяці тестування всередині Anthropic
Компанія тестувала Code Review на власних репозиторіях протягом кількох місяців. У великих PR (понад 1000 змінених рядків) інструмент фіксував баги у 84% випадків – у середньому 7,5 на один PR. Навіть у дрібних PR (до 50 рядків) – у кожному третьому. При цьому менше 1% зауважень інженери визнали хибними – тобто система майже не помиляється.
В одному з кейсів маленька правка у продакшн-сервісі виглядала рутинною і зазвичай отримала б швидке схвалення. Але Code Review класифікував її як критичну – зміна зламала б автентифікацію. Розробник потім зізнався, що сам не помітив би цього.
Схожу ефективність підтвердила команда TrueNAS: під час рефакторингу модуля шифрування Code Review знайшов старий баг у коді, який PR безпосередньо не змінював. Дефект тихо очищав кеш криптографічних ключів при кожній синхронізації – знайти таке вручну під час ревʼю майже неможливо.
Скільки коштує і хто вже може спробувати Code Review
Code Review – платний інструмент, ціна якого не входить у підписку. Середня вартість аналізу одного PR – $15–25 залежно від розміру та складності. Наразі він доступний у режимі research preview для підписників Team та Enterprise. Адміністратори можуть встановити місячний ліміт витрат на організацію, увімкнути перевірку лише для обраних репозиторіїв і відстежувати статистику через аналітичну панель. Code Review не схвалює PR самостійно – остаточне рішення залишається за людиною.
