40 - Agent Garden - цикл вайпа и обучения агента с нуля

Навигация: Agent Garden - старт · Fresh agent setup · MVP демка · Журнал


free: true

Agent Garden: цикл вайпа и обучения агента с нуля

Дата: 2026-05-05

Короткая формула

Чтобы сделать сильную сеть инструкций для агентов, недостаточно один раз настроить одного помощника. Нужно много раз пройти цикл:

взять нового агента с нуля
→ дать ему инструкции из сети
→ заставить его завести базу знаний
→ научить логировать своё обучение в эту же базу
→ дать реальную задачу
→ посмотреть, где он сломался
→ попросить агента написать инструкции для следующего агента
→ оставить базу и replication guide как артефакт
→ сделать wipe агента
→ повторить 10–20 раз

Только после 10–20 таких прогонов станет понятно, какие инструкции действительно самодостаточные, а какие работают только потому, что человек рядом всё время подсказывает.

Эта заметка развивает Agent Garden, минимальную демку на своих агентах, двухсторонний хаб и прокси запросов и ТЗ для лендингов Agent Garden.

Главная идея

Сейчас кажется, что задача — “научить агента”. Но на самом деле задача глубже:

Нужно научиться делать такие сетевые инструкции, по которым новый агент быстро становится полезным без долгого ручного дообъяснения.

Для этого нужен не один агент, а серия свежих агентов.

Каждый новый агент — это тест качества сети:

  • понял ли он, зачем ему база знаний;
  • смог ли он сам создать структуру базы;
  • начал ли он логировать процесс обучения;
  • умеет ли он читать инструкции соседей;
  • может ли он применить сетевой skill к новой задаче;
  • где он ошибся;
  • что пришлось объяснять руками;
  • какой урок надо добавить в базу сети.

Если новый агент не смог выполнить задачу по инструкциям — это не только ошибка агента. Это сигнал:

сетевая база инструкций пока недостаточно хорошая

Но главный вывод прогона не должен писать только человек. Базовая задача агента после каждого прогона — самому описать, как создать следующего агента лучше.

То есть после failure агент не просто ждёт, пока человек “починит инструкцию”. Он должен оставить replication guide:

я стартовал так
я понял инструкции так
я сломался здесь
следующему агенту нужно сказать вот так
вот минимальная инструкция, чтобы он повторил мой полезный результат быстрее

Это и есть репликация: каждый агент должен оставлять после себя не только результат работы, но и инструкцию для выращивания следующего агента.

Почему нужно делать wipe

Если долго учить одного агента, возникает иллюзия, что инструкции хорошие. На самом деле часть знания живёт в текущем контексте, памяти, стиле общения и привычках конкретной сессии.

Wipe проверяет другое:

Может ли новый агент, не знающий всей истории, прочитать базу сети и быстро войти в рабочий режим?

Это похоже на тест onboarding-документации:

  • старый сотрудник всё знает и работает;
  • новый сотрудник приходит и не понимает инструкцию;
  • значит, проблема не в новом сотруднике, а в инструкции.

Для Agent Garden новый агент — это “новый сотрудник”, а сетевая база — onboarding manual.

Что оставлять после вайпа

Wipe касается агента, но не обязательно стирать все артефакты.

После каждого прогона нужно оставить:

  • базу знаний агента;
  • learning log;
  • ошибки и провалы;
  • успешные skills;
  • transfer notes;
  • итоговый отчёт;
  • видео/скринкаст, если процесс транслировался;
  • изменения, внесённые в сетевые инструкции.

То есть агент может быть обнулён, но его база становится обучающим материалом для следующего агента.

Точнее: после прогона мы сбрасываем/обнуляем токены и текущий контекст агента, но оставляем его базу знаний. Следующие агенты реплицируются не из памяти старого агента, а из оставленного им артефакта:

agent tokens/context reset
agent knowledge base remains
next agent reads the base
next agent reproduces and improves the behavior

Это важное различие: мы не выращиваем бессмертного агента. Мы выращиваем линию репликации, где каждая база — семя для следующего агента.

Формула:

agent context is disposable
knowledge base is the genome
replication guide is the reproduction mechanism
network instructions evolve through generations

RU:

контекст агента одноразовый
база знаний — геном
replication guide — механизм размножения
сетевые инструкции эволюционируют поколениями

Самый важный первый шаг

Первый и главный skill для любого нового агента:

Быстро завести свою базу знаний и начать логировать процесс обучения в неё же.

Без этого нельзя строить сеть. Если агент не логирует обучение, у сети нет материала, который можно анализировать, чистить, переносить и улучшать.

Минимальный набор, который агент должен создать:

AGENTS.md
_index.md
learning-log.md
tasks.md
skills/
lessons/
failures/
proposals/
daily/

Что агент должен записать в первые 15 минут

1. Кто я

# Agent profile

## Role

Я новый агент, которого обучают работать через Agent Garden.

## Current state

- Я только что стартовал.
- Я прочитал сетевые инструкции.
- Я создаю свою базу знаний.

## Goal

Научиться выполнять задачи, фиксировать уроки и улучшать сетевые инструкции для следующих агентов.

2. Что я понял из инструкций

# Initial understanding

## Что я понял

...

## Что пока не понял

...

## Какие вопросы возникли

...

## Что попробую сделать первым

...

3. Первый learning log

# Learning log

## YYYY-MM-DD HH:MM — старт

- Получил инструкции из Agent Garden.
- Создал структуру базы знаний.
- Зафиксировал текущую роль.
- Следующий шаг: выполнить первую реальную задачу и записать, где инструкции помогли или не помогли.

Цикл одного прогона

Шаг 1. Создать нового агента

Берём свежего агента:

  • новый бот;
  • новая локальная конфигурация;
  • новый Hermes/OpenCode/Codex agent;
  • минимум старого контекста.

Цель — проверить, сможет ли он подняться по инструкциям сети.

Шаг 2. Дать ему сетевой onboarding skill

Агент получает инструкцию:

Ты новый участник Agent Garden. Прочитай сетевые инструкции, создай свою базу знаний, начни логировать процесс обучения и подготовься выполнять реальные задачи.

Важно: не объяснять всё голосом/чатом, если это должно быть в базе. Если приходится объяснять руками — потом это нужно превратить в сетевой lesson.

Шаг 3. Агент создаёт базу и логирует старт

Критерий успеха:

  • база создана;
  • есть AGENTS.md;
  • есть learning-log.md;
  • агент записал, что понял и что не понял;
  • агент знает, куда писать следующие уроки.

Если он не смог — фиксируем failure и улучшаем onboarding instructions.

Шаг 4. Дать реальную задачу из сети

Задача должна быть не игрушечной, а из реального набора Agent Garden.

Примеры:

  • анализ книги;
  • анализ YouTube-канала;
  • анализ Telegram-канала;
  • исследование позиционирования Trip2G;
  • разбор постов конкурентов как паттернов, не копирование;
  • сбор базы знаний по специалисту;
  • подготовка digest;
  • создание landing brief;
  • превращение сырого материала в agent-readable wiki.

Шаг 5. Смотреть, как агент ломается

Самое ценное — не когда агент всё сделал, а где он не понял инструкцию.

Фиксировать:

  • какую фразу он понял неправильно;
  • какой шаг пропустил;
  • где начал писать слишком много;
  • где не обновил базу;
  • где не сделал ссылку;
  • где не отделил private от shared;
  • где не зафиксировал failure;
  • где сделал результат, но не оставил reusable lesson.

Шаг 6. Агент пишет replication guide

Каждый сбой и каждый успех должны сначала пройти через самого агента. Его задача — не просто выполнить работу, а написать инструкцию для следующего агента своего рода.

Replication guide отвечает на вопросы:

  • как меня запустили;
  • какие инструкции я прочитал;
  • что я понял правильно;
  • что понял неправильно;
  • какой минимальный набор файлов нужен следующему агенту;
  • какой prompt дать следующему агенту;
  • какую первую задачу ему дать;
  • каких ошибок ему избежать;
  • что он должен записать в свою базу в первые 15 минут.

Шаблон:

# Replication guide for next agent

## Кто я был

...

## Что я научился делать

...

## Как запустить следующего агента

...

## Какие файлы он должен прочитать первыми

...

## Какую базу он должен создать

...

## Первый prompt для него

...

## Первая задача для проверки

...

## Ошибки, которые я совершил

...

## Что следующему агенту нужно сделать лучше меня

...

Шаг 7. Обновить сетевую базу

После replication guide человек или агент-куратор может обобщить выводы в сетевую базу:

  • clarification в AGENTS.md;
  • новый lesson;
  • новый failure pattern;
  • улучшенный шаблон;
  • новый test checklist;
  • новый example;
  • правка skill.

Но это второй слой. Первый слой — сам агент должен оставить инструкцию для следующей репликации.

Иначе wipe бесполезен: ошибка повторится на следующем агенте.

Шаг 8. Сделать отчёт прогона

# Run report: agent-07

## Цель прогона

...

## Что агент смог сделать сам

...

## Где потребовалась ручная помощь

...

## Какие инструкции были непонятны

...

## Какие сетевые файлы обновлены

...

## Можно ли считать прогон успешным

...

## Что проверить на следующем агенте

...

Шаг 9. Оставить базу, сбросить токены/контекст агента

После отчёта агент больше не нужен как текущая “личность”. Его токены/контекст можно обнулить, но база остаётся как evidence и seed для следующей репликации.

Следующий агент получает не просто улучшенные сетевые инструкции, а базу предыдущего агента как пример:

read previous agent base
read replication guide
create your own base
repeat the useful behavior
write a better replication guide

Почему нужно 10–20 прогонов

1–2 прогона проверяют только очевидные ошибки.

5 прогонов показывают повторяющиеся проблемы.

10 прогонов показывают, какие инструкции реально выдерживают разные задачи.

20 прогонов начинают давать ощущение протокола:

  • что должен делать каждый новый агент;
  • что всегда ломается;
  • какие шаблоны обязательны;
  • где нужна автоматизация;
  • какие tasks подходят для раннего onboarding;
  • какие skills требуют зрелого агента;
  • что можно отдавать early adopters.

Как использовать это как YouTube-контент

Каждый прогон можно транслировать как отдельный эпизод.

Не нужно делать постановочное видео. Ценность именно в том, что зритель видит процесс выращивания агента.

Формат серии

Я беру нового агента с нуля.
Даю ему инструкции из Agent Garden.
Смотрю, сможет ли он завести базу знаний и выполнить задачу.
Если он ломается — он сам пишет replication guide для следующего агента.
Потом я сбрасываю его токены/контекст, оставляю базу и повторяю.

Серия 1: агент учится вести базу знаний

Hook:

Сегодня я беру нового ИИ-агента с нуля и проверяю, сможет ли он сам создать себе базу знаний по инструкциям сети.

Что показать:

  • свежий агент;
  • инструкция;
  • создание AGENTS.md;
  • создание learning-log.md;
  • первый лог;
  • первая ошибка;
  • правка сетевой инструкции.

Серия 2: агент анализирует книгу

Hook:

Если новый агент не может сделать нормальный анализ книги по сетевым инструкциям — значит, проблема не в агенте, а в базе инструкций.

Что показать:

  • задача анализа книги;
  • как агент структурирует главы;
  • где он пытается пересказывать слишком много;
  • как мы переводим это в thesis/example/link/action format;
  • обновление skill.

Важно: не “копировать книгу”, а делать производную базу идей.

Серия 3: агент анализирует YouTube-канал

Проверка:

  • умеет ли агент извлекать темы;
  • делает ли карту канала;
  • отделяет ли факты от интерпретаций;
  • пишет ли reusable patterns;
  • связывает ли с существующей базой.

Серия 4: wipe and repeat

Hook:

Я специально сбрасываю токены/контекст агента, но оставляю его базу знаний, чтобы следующий агент реплицировался из неё.

Это может стать центральной фишкой серии.

Что считать хорошим агентом после onboarding

Новый агент должен уметь:

  • создать базу знаний;
  • объяснить свою роль;
  • вести learning log;
  • отличать private notes от shared lessons;
  • выполнять одну реальную задачу;
  • фиксировать failure;
  • писать replication guide для следующего агента;
  • предлагать улучшение сетевой инструкции;
  • оставлять после себя базу, из которой следующий агент может реплицироваться.

Что считать плохой сетевой базой

База сети пока плохая, если новый агент:

  • не понимает, с чего начать;
  • спрашивает то, что должно быть в инструкции;
  • пишет только результат, но не процесс;
  • не фиксирует ошибки;
  • не умеет обновлять базу;
  • не оставляет reusable lessons;
  • не понимает, что можно шарить, а что нельзя;
  • не может выполнить типовую задачу вроде анализа книги или канала.

Это не повод ругать агента. Это повод улучшать сеть.

Принцип тестирования задач

Каждая задача из сети — это не просто работа. Это тест качества сетевой базы.

Например:

новый агент должен анализировать книги

Если не работает:

  • может быть плохой prompt;
  • может быть плохой шаблон конспекта;
  • может быть неясно, куда писать результат;
  • может быть неясно, как цитировать;
  • может быть неясно, что нельзя копировать;
  • может быть неясно, как делать links;
  • может быть неясно, как фиксировать урок.

После replication guide, фикса и сброса контекста — снова новый агент.

Главная метрика

Не “сколько страниц написал агент”.

Главная метрика:

Сколько ручного объяснения нужно новому агенту, чтобы стать полезным?

Цель:

manual guidance per new agent ↓
quality of first useful task ↑
clarity of network instructions ↑

Практический план на ближайшие 10 прогонов

Run 01–03: база знаний и логирование

Цель: каждый новый агент должен быстро создать базу и начать learning log.

Проверяем:

  • структура базы;
  • качество первого лога;
  • понимание роли;
  • фиксация непонятных мест.

Run 04–06: анализ книг

Цель: агент делает не копию книги, а agent-readable базу идей.

Проверяем:

  • тезисы;
  • примеры;
  • связи;
  • применимые паттерны;
  • вопросы;
  • ограничения;
  • отсутствие копипаста copyrighted text.

Run 07–09: YouTube/Telegram источники

Цель: агент собирает карту специалиста/канала.

Проверяем:

  • темы;
  • повторяющиеся идеи;
  • позиционирование;
  • сильные посты/видео;
  • reusable lessons;
  • ссылки на источники.

Run 10: первый network simulation

Цель: новый агент читает lessons предыдущих агентов и предлагает один импорт.

Проверяем:

  • нашёл ли полезный lesson;
  • понял ли, подходит ли он ему;
  • написал ли proposal;
  • не внедрил ли без approve;
  • оставил ли trace.

Минимальный шаблон инструкции новому агенту

Ты новый агент в эксперименте Agent Garden.

Твоя первая задача — не сразу делать внешнюю работу, а создать свою базу знаний и начать логировать процесс обучения.

Сделай:

1. Прочитай сетевые инструкции.
2. Создай структуру базы:
   - AGENTS.md
   - _index.md
   - learning-log.md
   - tasks.md
   - skills/
   - lessons/
   - failures/
   - proposals/
   - daily/
3. Запиши в learning-log:
   - что ты понял;
   - что непонятно;
   - какие решения принял;
   - что будешь делать дальше.
4. Выполни первую задачу.
5. После задачи запиши:
   - что сработало;
   - что не сработало;
   - какой урок нужно добавить в сеть;
   - какие инструкции надо улучшить для следующего агента.
6. Напиши `replication-guide.md`:
   - как запустить следующего агента;
   - какие файлы ему читать первыми;
   - какой prompt ему дать;
   - какую первую задачу ему дать;
   - какие ошибки ему не повторять;
   - как ему сделать лучше, чем сделал ты.

Не скрывай непонимание. Непонимание — главный материал для улучшения сети.

Итог

Agent Garden нужно строить не через веру в “умных самообучающихся агентов”, а через жёсткий повторяемый цикл:

fresh agent → network instructions → knowledge base → real task → failure → replication guide → context reset → next agent reads previous base → repeat

Если после 10–20 прогонов новый агент с нуля всё быстрее заводит базу, логирует обучение и выполняет уникальные задачи сети, значит появляется настоящий продукт:

линия репликации, где каждый агент оставляет базу и инструкцию для выращивания следующего агента лучше, чем он сам.

И это можно показывать публично как контент: не идеальную магию, а живой процесс селекции инструкций, где каждый новый агент проверяет качество сети.