Три паттерна под растущий Claude: инструменты, ревизия harness и границы

Генеративные системы вроде Claude скорее выращивают, чем собирают по чертежу: задаёшь условия, а точный набор способностей со временем меняется. Для разработчика это значит другое: обвязка агента закладывает допущения о том, что модель «не умеет сама», и эти допущения со временем протухают. В материале Anthropic предлагают держать баланс между силой модели, задержкой и ценой тремя практиками.
Опирайтесь на то, что модель уже знает
Имеет смысл строить сценарии на инструментах, с которыми Claude хорошо знаком. В примере из статьи Sonnet добивался сильных результатов на SWE-bench с минимальным набором — bash и текстовый редактор для чтения и правки файлов. Bash не проектировали под агентов, но это тот инструмент, которым модель пользуется и к которому привыкает. На том же фундаменте стоят и композиции вроде программируемого вызова инструментов, Agent Skills и memory — их собирают из тех же базовых кирпичей.
Спросите: что можно перестать делать?
Harness кодирует гипотезы о слабых местах модели. Когда модель становится сильнее, часть логики в обвязке превращается в лишнюю задержку и стоимость. Полезно регулярно пересматривать: какие проверки, обходные пути и «костыли» уже не нужны.
Осознанно задавайте границы harness
Третья линия — не раздувать и не устаревать рамки агента: границы должны соответствовать текущим возможностям, иначе вы платите за сложность без выигрыша в качестве.
Итог простой: чем быстрее растёт модель, тем чаще стоит перепроверять инструменты, лишнюю обвязку и границы агента — иначе архитектура отстаёт от интеллекта.
Источник: блог Anthropic — Harnessing Claude’s Intelligence