Три паттерна под растущий Claude: инструменты, ревизия harness и границы

Генеративные системы вроде Claude скорее выращивают, чем собирают по чертежу: задаёшь условия, а точный набор способностей со временем меняется. Для разработчика это значит другое: обвязка агента закладывает допущения о том, что модель «не умеет сама», и эти допущения со временем протухают. В материале Anthropic предлагают держать баланс между силой модели, задержкой и ценой тремя практиками.

Опирайтесь на то, что модель уже знает

Имеет смысл строить сценарии на инструментах, с которыми Claude хорошо знаком. В примере из статьи Sonnet добивался сильных результатов на SWE-bench с минимальным набором — bash и текстовый редактор для чтения и правки файлов. Bash не проектировали под агентов, но это тот инструмент, которым модель пользуется и к которому привыкает. На том же фундаменте стоят и композиции вроде программируемого вызова инструментов, Agent Skills и memory — их собирают из тех же базовых кирпичей.

Спросите: что можно перестать делать?

Harness кодирует гипотезы о слабых местах модели. Когда модель становится сильнее, часть логики в обвязке превращается в лишнюю задержку и стоимость. Полезно регулярно пересматривать: какие проверки, обходные пути и «костыли» уже не нужны.

Осознанно задавайте границы harness

Третья линия — не раздувать и не устаревать рамки агента: границы должны соответствовать текущим возможностям, иначе вы платите за сложность без выигрыша в качестве.

Итог простой: чем быстрее растёт модель, тем чаще стоит перепроверять инструменты, лишнюю обвязку и границы агента — иначе архитектура отстаёт от интеллекта.

Источник: блог Anthropic — Harnessing Claude’s Intelligence