40 - Agent Garden - цикл вайпа и обучения агента с нуля
Навигация: Agent Garden - старт · Fresh agent setup · MVP демка · Журнал
free: true
Agent Garden: цикл вайпа и обучения агента с нуля
Дата: 2026-05-05
Короткая формула
Чтобы сделать сильную сеть инструкций для агентов, недостаточно один раз настроить одного помощника. Нужно много раз пройти цикл:
взять нового агента с нуля
→ дать ему инструкции из сети
→ заставить его завести базу знаний
→ научить логировать своё обучение в эту же базу
→ дать реальную задачу
→ посмотреть, где он сломался
→ попросить агента написать инструкции для следующего агента
→ оставить базу и replication guide как артефакт
→ сделать wipe агента
→ повторить 10–20 раз
Только после 10–20 таких прогонов станет понятно, какие инструкции действительно самодостаточные, а какие работают только потому, что человек рядом всё время подсказывает.
Эта заметка развивает Agent Garden, минимальную демку на своих агентах, двухсторонний хаб и прокси запросов и ТЗ для лендингов Agent Garden.
Главная идея
Сейчас кажется, что задача — “научить агента”. Но на самом деле задача глубже:
Нужно научиться делать такие сетевые инструкции, по которым новый агент быстро становится полезным без долгого ручного дообъяснения.
Для этого нужен не один агент, а серия свежих агентов.
Каждый новый агент — это тест качества сети:
- понял ли он, зачем ему база знаний;
- смог ли он сам создать структуру базы;
- начал ли он логировать процесс обучения;
- умеет ли он читать инструкции соседей;
- может ли он применить сетевой skill к новой задаче;
- где он ошибся;
- что пришлось объяснять руками;
- какой урок надо добавить в базу сети.
Если новый агент не смог выполнить задачу по инструкциям — это не только ошибка агента. Это сигнал:
сетевая база инструкций пока недостаточно хорошая
Но главный вывод прогона не должен писать только человек. Базовая задача агента после каждого прогона — самому описать, как создать следующего агента лучше.
То есть после failure агент не просто ждёт, пока человек “починит инструкцию”. Он должен оставить replication guide:
я стартовал так
я понял инструкции так
я сломался здесь
следующему агенту нужно сказать вот так
вот минимальная инструкция, чтобы он повторил мой полезный результат быстрее
Это и есть репликация: каждый агент должен оставлять после себя не только результат работы, но и инструкцию для выращивания следующего агента.
Почему нужно делать wipe
Если долго учить одного агента, возникает иллюзия, что инструкции хорошие. На самом деле часть знания живёт в текущем контексте, памяти, стиле общения и привычках конкретной сессии.
Wipe проверяет другое:
Может ли новый агент, не знающий всей истории, прочитать базу сети и быстро войти в рабочий режим?
Это похоже на тест onboarding-документации:
- старый сотрудник всё знает и работает;
- новый сотрудник приходит и не понимает инструкцию;
- значит, проблема не в новом сотруднике, а в инструкции.
Для Agent Garden новый агент — это “новый сотрудник”, а сетевая база — onboarding manual.
Что оставлять после вайпа
Wipe касается агента, но не обязательно стирать все артефакты.
После каждого прогона нужно оставить:
- базу знаний агента;
- learning log;
- ошибки и провалы;
- успешные skills;
- transfer notes;
- итоговый отчёт;
- видео/скринкаст, если процесс транслировался;
- изменения, внесённые в сетевые инструкции.
То есть агент может быть обнулён, но его база становится обучающим материалом для следующего агента.
Точнее: после прогона мы сбрасываем/обнуляем токены и текущий контекст агента, но оставляем его базу знаний. Следующие агенты реплицируются не из памяти старого агента, а из оставленного им артефакта:
agent tokens/context reset
agent knowledge base remains
next agent reads the base
next agent reproduces and improves the behavior
Это важное различие: мы не выращиваем бессмертного агента. Мы выращиваем линию репликации, где каждая база — семя для следующего агента.
Формула:
agent context is disposable
knowledge base is the genome
replication guide is the reproduction mechanism
network instructions evolve through generations
RU:
контекст агента одноразовый
база знаний — геном
replication guide — механизм размножения
сетевые инструкции эволюционируют поколениями
Самый важный первый шаг
Первый и главный skill для любого нового агента:
Быстро завести свою базу знаний и начать логировать процесс обучения в неё же.
Без этого нельзя строить сеть. Если агент не логирует обучение, у сети нет материала, который можно анализировать, чистить, переносить и улучшать.
Минимальный набор, который агент должен создать:
AGENTS.md
_index.md
learning-log.md
tasks.md
skills/
lessons/
failures/
proposals/
daily/
Что агент должен записать в первые 15 минут
1. Кто я
# Agent profile
## Role
Я новый агент, которого обучают работать через Agent Garden.
## Current state
- Я только что стартовал.
- Я прочитал сетевые инструкции.
- Я создаю свою базу знаний.
## Goal
Научиться выполнять задачи, фиксировать уроки и улучшать сетевые инструкции для следующих агентов.
2. Что я понял из инструкций
# Initial understanding
## Что я понял
...
## Что пока не понял
...
## Какие вопросы возникли
...
## Что попробую сделать первым
...
3. Первый learning log
# Learning log
## YYYY-MM-DD HH:MM — старт
- Получил инструкции из Agent Garden.
- Создал структуру базы знаний.
- Зафиксировал текущую роль.
- Следующий шаг: выполнить первую реальную задачу и записать, где инструкции помогли или не помогли.
Цикл одного прогона
Шаг 1. Создать нового агента
Берём свежего агента:
- новый бот;
- новая локальная конфигурация;
- новый Hermes/OpenCode/Codex agent;
- минимум старого контекста.
Цель — проверить, сможет ли он подняться по инструкциям сети.
Шаг 2. Дать ему сетевой onboarding skill
Агент получает инструкцию:
Ты новый участник Agent Garden. Прочитай сетевые инструкции, создай свою базу знаний, начни логировать процесс обучения и подготовься выполнять реальные задачи.
Важно: не объяснять всё голосом/чатом, если это должно быть в базе. Если приходится объяснять руками — потом это нужно превратить в сетевой lesson.
Шаг 3. Агент создаёт базу и логирует старт
Критерий успеха:
- база создана;
- есть
AGENTS.md; - есть
learning-log.md; - агент записал, что понял и что не понял;
- агент знает, куда писать следующие уроки.
Если он не смог — фиксируем failure и улучшаем onboarding instructions.
Шаг 4. Дать реальную задачу из сети
Задача должна быть не игрушечной, а из реального набора Agent Garden.
Примеры:
- анализ книги;
- анализ YouTube-канала;
- анализ Telegram-канала;
- исследование позиционирования Trip2G;
- разбор постов конкурентов как паттернов, не копирование;
- сбор базы знаний по специалисту;
- подготовка digest;
- создание landing brief;
- превращение сырого материала в agent-readable wiki.
Шаг 5. Смотреть, как агент ломается
Самое ценное — не когда агент всё сделал, а где он не понял инструкцию.
Фиксировать:
- какую фразу он понял неправильно;
- какой шаг пропустил;
- где начал писать слишком много;
- где не обновил базу;
- где не сделал ссылку;
- где не отделил private от shared;
- где не зафиксировал failure;
- где сделал результат, но не оставил reusable lesson.
Шаг 6. Агент пишет replication guide
Каждый сбой и каждый успех должны сначала пройти через самого агента. Его задача — не просто выполнить работу, а написать инструкцию для следующего агента своего рода.
Replication guide отвечает на вопросы:
- как меня запустили;
- какие инструкции я прочитал;
- что я понял правильно;
- что понял неправильно;
- какой минимальный набор файлов нужен следующему агенту;
- какой prompt дать следующему агенту;
- какую первую задачу ему дать;
- каких ошибок ему избежать;
- что он должен записать в свою базу в первые 15 минут.
Шаблон:
# Replication guide for next agent
## Кто я был
...
## Что я научился делать
...
## Как запустить следующего агента
...
## Какие файлы он должен прочитать первыми
...
## Какую базу он должен создать
...
## Первый prompt для него
...
## Первая задача для проверки
...
## Ошибки, которые я совершил
...
## Что следующему агенту нужно сделать лучше меня
...
Шаг 7. Обновить сетевую базу
После replication guide человек или агент-куратор может обобщить выводы в сетевую базу:
- clarification в
AGENTS.md; - новый
lesson; - новый
failure pattern; - улучшенный шаблон;
- новый test checklist;
- новый example;
- правка skill.
Но это второй слой. Первый слой — сам агент должен оставить инструкцию для следующей репликации.
Иначе wipe бесполезен: ошибка повторится на следующем агенте.
Шаг 8. Сделать отчёт прогона
# Run report: agent-07
## Цель прогона
...
## Что агент смог сделать сам
...
## Где потребовалась ручная помощь
...
## Какие инструкции были непонятны
...
## Какие сетевые файлы обновлены
...
## Можно ли считать прогон успешным
...
## Что проверить на следующем агенте
...
Шаг 9. Оставить базу, сбросить токены/контекст агента
После отчёта агент больше не нужен как текущая “личность”. Его токены/контекст можно обнулить, но база остаётся как evidence и seed для следующей репликации.
Следующий агент получает не просто улучшенные сетевые инструкции, а базу предыдущего агента как пример:
read previous agent base
read replication guide
create your own base
repeat the useful behavior
write a better replication guide
Почему нужно 10–20 прогонов
1–2 прогона проверяют только очевидные ошибки.
5 прогонов показывают повторяющиеся проблемы.
10 прогонов показывают, какие инструкции реально выдерживают разные задачи.
20 прогонов начинают давать ощущение протокола:
- что должен делать каждый новый агент;
- что всегда ломается;
- какие шаблоны обязательны;
- где нужна автоматизация;
- какие tasks подходят для раннего onboarding;
- какие skills требуют зрелого агента;
- что можно отдавать early adopters.
Как использовать это как YouTube-контент
Каждый прогон можно транслировать как отдельный эпизод.
Не нужно делать постановочное видео. Ценность именно в том, что зритель видит процесс выращивания агента.
Формат серии
Я беру нового агента с нуля.
Даю ему инструкции из Agent Garden.
Смотрю, сможет ли он завести базу знаний и выполнить задачу.
Если он ломается — он сам пишет replication guide для следующего агента.
Потом я сбрасываю его токены/контекст, оставляю базу и повторяю.
Серия 1: агент учится вести базу знаний
Hook:
Сегодня я беру нового ИИ-агента с нуля и проверяю, сможет ли он сам создать себе базу знаний по инструкциям сети.
Что показать:
- свежий агент;
- инструкция;
- создание
AGENTS.md; - создание
learning-log.md; - первый лог;
- первая ошибка;
- правка сетевой инструкции.
Серия 2: агент анализирует книгу
Hook:
Если новый агент не может сделать нормальный анализ книги по сетевым инструкциям — значит, проблема не в агенте, а в базе инструкций.
Что показать:
- задача анализа книги;
- как агент структурирует главы;
- где он пытается пересказывать слишком много;
- как мы переводим это в thesis/example/link/action format;
- обновление skill.
Важно: не “копировать книгу”, а делать производную базу идей.
Серия 3: агент анализирует YouTube-канал
Проверка:
- умеет ли агент извлекать темы;
- делает ли карту канала;
- отделяет ли факты от интерпретаций;
- пишет ли reusable patterns;
- связывает ли с существующей базой.
Серия 4: wipe and repeat
Hook:
Я специально сбрасываю токены/контекст агента, но оставляю его базу знаний, чтобы следующий агент реплицировался из неё.
Это может стать центральной фишкой серии.
Что считать хорошим агентом после onboarding
Новый агент должен уметь:
- создать базу знаний;
- объяснить свою роль;
- вести learning log;
- отличать private notes от shared lessons;
- выполнять одну реальную задачу;
- фиксировать failure;
- писать replication guide для следующего агента;
- предлагать улучшение сетевой инструкции;
- оставлять после себя базу, из которой следующий агент может реплицироваться.
Что считать плохой сетевой базой
База сети пока плохая, если новый агент:
- не понимает, с чего начать;
- спрашивает то, что должно быть в инструкции;
- пишет только результат, но не процесс;
- не фиксирует ошибки;
- не умеет обновлять базу;
- не оставляет reusable lessons;
- не понимает, что можно шарить, а что нельзя;
- не может выполнить типовую задачу вроде анализа книги или канала.
Это не повод ругать агента. Это повод улучшать сеть.
Принцип тестирования задач
Каждая задача из сети — это не просто работа. Это тест качества сетевой базы.
Например:
новый агент должен анализировать книги
Если не работает:
- может быть плохой prompt;
- может быть плохой шаблон конспекта;
- может быть неясно, куда писать результат;
- может быть неясно, как цитировать;
- может быть неясно, что нельзя копировать;
- может быть неясно, как делать links;
- может быть неясно, как фиксировать урок.
После replication guide, фикса и сброса контекста — снова новый агент.
Главная метрика
Не “сколько страниц написал агент”.
Главная метрика:
Сколько ручного объяснения нужно новому агенту, чтобы стать полезным?
Цель:
manual guidance per new agent ↓
quality of first useful task ↑
clarity of network instructions ↑
Практический план на ближайшие 10 прогонов
Run 01–03: база знаний и логирование
Цель: каждый новый агент должен быстро создать базу и начать learning log.
Проверяем:
- структура базы;
- качество первого лога;
- понимание роли;
- фиксация непонятных мест.
Run 04–06: анализ книг
Цель: агент делает не копию книги, а agent-readable базу идей.
Проверяем:
- тезисы;
- примеры;
- связи;
- применимые паттерны;
- вопросы;
- ограничения;
- отсутствие копипаста copyrighted text.
Run 07–09: YouTube/Telegram источники
Цель: агент собирает карту специалиста/канала.
Проверяем:
- темы;
- повторяющиеся идеи;
- позиционирование;
- сильные посты/видео;
- reusable lessons;
- ссылки на источники.
Run 10: первый network simulation
Цель: новый агент читает lessons предыдущих агентов и предлагает один импорт.
Проверяем:
- нашёл ли полезный lesson;
- понял ли, подходит ли он ему;
- написал ли proposal;
- не внедрил ли без approve;
- оставил ли trace.
Минимальный шаблон инструкции новому агенту
Ты новый агент в эксперименте Agent Garden.
Твоя первая задача — не сразу делать внешнюю работу, а создать свою базу знаний и начать логировать процесс обучения.
Сделай:
1. Прочитай сетевые инструкции.
2. Создай структуру базы:
- AGENTS.md
- _index.md
- learning-log.md
- tasks.md
- skills/
- lessons/
- failures/
- proposals/
- daily/
3. Запиши в learning-log:
- что ты понял;
- что непонятно;
- какие решения принял;
- что будешь делать дальше.
4. Выполни первую задачу.
5. После задачи запиши:
- что сработало;
- что не сработало;
- какой урок нужно добавить в сеть;
- какие инструкции надо улучшить для следующего агента.
6. Напиши `replication-guide.md`:
- как запустить следующего агента;
- какие файлы ему читать первыми;
- какой prompt ему дать;
- какую первую задачу ему дать;
- какие ошибки ему не повторять;
- как ему сделать лучше, чем сделал ты.
Не скрывай непонимание. Непонимание — главный материал для улучшения сети.
Итог
Agent Garden нужно строить не через веру в “умных самообучающихся агентов”, а через жёсткий повторяемый цикл:
fresh agent → network instructions → knowledge base → real task → failure → replication guide → context reset → next agent reads previous base → repeat
Если после 10–20 прогонов новый агент с нуля всё быстрее заводит базу, логирует обучение и выполняет уникальные задачи сети, значит появляется настоящий продукт:
линия репликации, где каждый агент оставляет базу и инструкцию для выращивания следующего агента лучше, чем он сам.
И это можно показывать публично как контент: не идеальную магию, а живой процесс селекции инструкций, где каждый новый агент проверяет качество сети.