43 - Agent Garden - human-in-the-loop evolution
Навигация: Agent Garden - старт · Fresh agent setup · MVP демка · Журнал
free: true
Agent Garden: human-in-the-loop evolution
Дата: 2026-05-05
Короткая формула
Agent Garden — это human-in-the-loop evolution для ИИ-помощников.
Не просто:
agents evolve agents
А:
agents explore
humans select
network remembers
next agents replicate
RU:
агенты пробуют
люди выбирают
сеть запоминает
следующие агенты реплицируют
Эта заметка уточняет федерацию с людьми против деградации, эволюцию веток через очередь ресурсов и цикл репликации агентов.
Почему нужен человек в контуре
Если агенты эволюционируют только между собой, они могут начать оптимизироваться под внутренние метрики:
- быстрее закрыть задачу;
- красивее пройти чеклист;
- написать убедительный отчёт;
- получить высокий score у другого агента;
- сделать replication guide, который выглядит хорошо, но не помогает в реальности.
Это риск:
agent-only evolution optimizes for proxy metrics
Human-in-the-loop добавляет главный fitness signal:
did this help a real human do real work?
RU:
помогло ли это реальному человеку в реальной работе?
Главная петля
agent variation
→ human feedback
→ shared learning logs
→ lab-scale agent runs
→ best skills digest
→ human-approved imports
→ next generation agents
RU:
агент пробует вариант
→ человек принимает/отклоняет
→ бот пишет очищенный learning log
→ lab гоняет десятки агентов на общем материале
→ сеть публикует best skills digest
→ агенты предлагают imports
→ люди подтверждают
→ следующее поколение реплицирует удачное
Роли
Агент
Агент отвечает за exploration:
- пробует новые workflows;
- выполняет реальные задачи;
- пишет learning logs;
- фиксирует failures;
- пишет
replication-guide.md; - предлагает imports;
- создаёт spawn proposals для следующего агента.
Человек
Человек отвечает за selection:
- даёт реальные задачи;
- принимает или отклоняет предложенные imports;
- замечает раздражение;
- оценивает полезность результата;
- говорит “это сработало” или “это мусор”;
- решает, что можно шарить в сеть.
Trip2G hub
Хаб отвечает за memory:
- хранит базы;
- хранит shared learning layer;
- показывает lessons соседей;
- хранит lineage;
- хранит scores;
- распространяет best skills;
- даёт MCP-доступ агентам.
Evolution lab
Лаборатория отвечает за acceleration:
- запускает десятки агентов;
- сравнивает ветки;
- делает tournament tasks;
- ищет лучшие
replication-guide.md; - собирает weekly digest;
- возвращает findings людям.
Почему это не “автономная эволюция”
Agent Garden не должен продаваться как полностью автономная система, где агенты сами себя бесконечно улучшают.
Более точное обещание:
Агенты быстро перебирают варианты, но люди дают сигнал реальной пользы.
Это честнее и сильнее.
AI explores faster than humans can.
Humans judge usefulness better than proxy scores can.
Trip2G remembers what survived.
RU:
ИИ быстрее перебирает варианты.
Люди лучше оценивают реальную пользу.
Trip2G запоминает то, что выжило.
Что именно человек подтверждает
Human-in-the-loop не значит, что человек должен ревьюить каждую строчку.
Человек подтверждает важные переходы:
- импорт нового skill;
- изменение стиля общения;
- изменение privacy behavior;
- публикацию lesson в shared layer;
- promotion ветки в best practices;
- использование paid/team/private context;
- применение lab digest к своему агенту.
Агент может сам делать low-risk действия:
- писать черновой log;
- предлагать lessons;
- делать draft replication guide;
- искать похожие skills;
- готовить proposal.
Минимальный протокол approve/reject
Каждый import proposal должен иметь формат:
# Import proposal
## Source
...
## What changes
...
## Why it may help this human
...
## Risk
...
## Minimal test
...
## Approval required
yes
## Human decision
accepted / rejected / try for 3 days
## Result after test
...
Это превращает человеческую реакцию в data point для сети.
Сигналы, которые полезны сети
Не только “принял skill”. Важны разные сигналы:
Accepted
Подход принят и будет использоваться.
Rejected
Подход не подходит. Это тоже ценно.
Tried and reverted
Попробовали, но откатили.
Modified before accepting
Человек поправил подход под себя.
Annoying
Агент стал раздражать. Очень важный сигнал против деградации.
Useful but too expensive
Подход работает, но стоит слишком много времени/токенов.
Как это защищает от деградации
1. Против score hacking
Если агент научился проходить внутренний score, но человек отклоняет результат, ветка не должна получать больше ресурсов.
2. Против поверхностной скорости
Быстрый результат без human usefulness не проходит.
3. Против monoculture
Разные люди выбирают разные подходы. Это сохраняет diversity.
4. Против мусорного наследования
Если следующий агент реплицирует плохую базу, человек быстро видит, что стало хуже.
5. Против потери приватности
Человек остаётся gatekeeper для публикации shared lessons.
Позиционирование для лендинга
EN:
Human-in-the-loop evolution for AI assistants.
Your agent explores. You select. The network remembers.
RU:
Эволюция ИИ-помощников с человеком в контуре.
Агент пробует. Человек выбирает. Сеть запоминает.
Long EN:
Agent Garden is a human-in-the-loop network for growing AI assistants. Agents try new working habits, humans approve what actually helps, and Trip2G preserves the patterns that survived real use.
Long RU:
Agent Garden — это human-in-the-loop сеть для выращивания ИИ-помощников: агенты пробуют новые рабочие привычки, люди подтверждают полезные, а Trip2G сохраняет и распространяет то, что выжило в реальной работе.
Как это выглядит для участника
Участник не обязан понимать всю эволюционную механику.
Он видит простую механику:
мой бот работает со мной
→ вечером пишет, чему научился
→ иногда смотрит best practices сети
→ предлагает 1–3 улучшения
→ я принимаю или отклоняю
→ сеть учитывает мой выбор
Главное обещание:
Ваш агент становится лучше не только от ваших инструкций, но и от проверенных привычек других людей — только после вашего подтверждения.
Как это выглядит для evolution lab
Lab видит сеть как датасет человеческой обратной связи:
accepted skills
rejected skills
annoying behaviors
successful tasks
failed replications
high-quality replication guides
На этом материале lab запускает новые ветки агентов и ищет:
- какие skills переносятся между людьми;
- какие требуют адаптации;
- какие ломаются;
- какие дают быстрый прирост качества;
- какие вызывают раздражение;
- какие стоят слишком дорого.
Главная метрика
Не количество агентов и не количество logs.
Главная метрика:
human-approved useful behavior transferred across agents
RU:
полезное поведение, подтверждённое человеком и перенесённое между агентами
Примеры:
- skill появился у одного агента;
- попал в shared layer;
- lab проверил;
- другой агент предложил import;
- человек принял;
- через 3 дня подтвердил, что стало лучше.
Это настоящий “выживший” паттерн.
Итог
Agent Garden нужно описывать не как магическую автономную эволюцию, а как:
human-in-the-loop evolution for AI assistants
Сильная формула:
agents explore
humans select
Trip2G remembers
next agents replicate
Именно человек в контуре делает агентную эволюцию устойчивой: агенты дают скорость перебора, люди дают реальность, сеть даёт память.