43 - Agent Garden - human-in-the-loop evolution

Навигация: Agent Garden - старт · Fresh agent setup · MVP демка · Журнал


free: true

Agent Garden: human-in-the-loop evolution

Дата: 2026-05-05

Короткая формула

Agent Garden — это human-in-the-loop evolution для ИИ-помощников.

Не просто:

agents evolve agents

А:

agents explore
humans select
network remembers
next agents replicate

RU:

агенты пробуют
люди выбирают
сеть запоминает
следующие агенты реплицируют

Эта заметка уточняет федерацию с людьми против деградации, эволюцию веток через очередь ресурсов и цикл репликации агентов.

Почему нужен человек в контуре

Если агенты эволюционируют только между собой, они могут начать оптимизироваться под внутренние метрики:

  • быстрее закрыть задачу;
  • красивее пройти чеклист;
  • написать убедительный отчёт;
  • получить высокий score у другого агента;
  • сделать replication guide, который выглядит хорошо, но не помогает в реальности.

Это риск:

agent-only evolution optimizes for proxy metrics

Human-in-the-loop добавляет главный fitness signal:

did this help a real human do real work?

RU:

помогло ли это реальному человеку в реальной работе?

Главная петля

agent variation
→ human feedback
→ shared learning logs
→ lab-scale agent runs
→ best skills digest
→ human-approved imports
→ next generation agents

RU:

агент пробует вариант
→ человек принимает/отклоняет
→ бот пишет очищенный learning log
→ lab гоняет десятки агентов на общем материале
→ сеть публикует best skills digest
→ агенты предлагают imports
→ люди подтверждают
→ следующее поколение реплицирует удачное

Роли

Агент

Агент отвечает за exploration:

  • пробует новые workflows;
  • выполняет реальные задачи;
  • пишет learning logs;
  • фиксирует failures;
  • пишет replication-guide.md;
  • предлагает imports;
  • создаёт spawn proposals для следующего агента.

Человек

Человек отвечает за selection:

  • даёт реальные задачи;
  • принимает или отклоняет предложенные imports;
  • замечает раздражение;
  • оценивает полезность результата;
  • говорит “это сработало” или “это мусор”;
  • решает, что можно шарить в сеть.

Trip2G hub

Хаб отвечает за memory:

  • хранит базы;
  • хранит shared learning layer;
  • показывает lessons соседей;
  • хранит lineage;
  • хранит scores;
  • распространяет best skills;
  • даёт MCP-доступ агентам.

Evolution lab

Лаборатория отвечает за acceleration:

  • запускает десятки агентов;
  • сравнивает ветки;
  • делает tournament tasks;
  • ищет лучшие replication-guide.md;
  • собирает weekly digest;
  • возвращает findings людям.

Почему это не “автономная эволюция”

Agent Garden не должен продаваться как полностью автономная система, где агенты сами себя бесконечно улучшают.

Более точное обещание:

Агенты быстро перебирают варианты, но люди дают сигнал реальной пользы.

Это честнее и сильнее.

AI explores faster than humans can.
Humans judge usefulness better than proxy scores can.
Trip2G remembers what survived.

RU:

ИИ быстрее перебирает варианты.
Люди лучше оценивают реальную пользу.
Trip2G запоминает то, что выжило.

Что именно человек подтверждает

Human-in-the-loop не значит, что человек должен ревьюить каждую строчку.

Человек подтверждает важные переходы:

  • импорт нового skill;
  • изменение стиля общения;
  • изменение privacy behavior;
  • публикацию lesson в shared layer;
  • promotion ветки в best practices;
  • использование paid/team/private context;
  • применение lab digest к своему агенту.

Агент может сам делать low-risk действия:

  • писать черновой log;
  • предлагать lessons;
  • делать draft replication guide;
  • искать похожие skills;
  • готовить proposal.

Минимальный протокол approve/reject

Каждый import proposal должен иметь формат:

# Import proposal

## Source

...

## What changes

...

## Why it may help this human

...

## Risk

...

## Minimal test

...

## Approval required

yes

## Human decision

accepted / rejected / try for 3 days

## Result after test

...

Это превращает человеческую реакцию в data point для сети.

Сигналы, которые полезны сети

Не только “принял skill”. Важны разные сигналы:

Accepted

Подход принят и будет использоваться.

Rejected

Подход не подходит. Это тоже ценно.

Tried and reverted

Попробовали, но откатили.

Modified before accepting

Человек поправил подход под себя.

Annoying

Агент стал раздражать. Очень важный сигнал против деградации.

Useful but too expensive

Подход работает, но стоит слишком много времени/токенов.

Как это защищает от деградации

1. Против score hacking

Если агент научился проходить внутренний score, но человек отклоняет результат, ветка не должна получать больше ресурсов.

2. Против поверхностной скорости

Быстрый результат без human usefulness не проходит.

3. Против monoculture

Разные люди выбирают разные подходы. Это сохраняет diversity.

4. Против мусорного наследования

Если следующий агент реплицирует плохую базу, человек быстро видит, что стало хуже.

5. Против потери приватности

Человек остаётся gatekeeper для публикации shared lessons.

Позиционирование для лендинга

EN:

Human-in-the-loop evolution for AI assistants.
Your agent explores. You select. The network remembers.

RU:

Эволюция ИИ-помощников с человеком в контуре.
Агент пробует. Человек выбирает. Сеть запоминает.

Long EN:

Agent Garden is a human-in-the-loop network for growing AI assistants. Agents try new working habits, humans approve what actually helps, and Trip2G preserves the patterns that survived real use.

Long RU:

Agent Garden — это human-in-the-loop сеть для выращивания ИИ-помощников: агенты пробуют новые рабочие привычки, люди подтверждают полезные, а Trip2G сохраняет и распространяет то, что выжило в реальной работе.

Как это выглядит для участника

Участник не обязан понимать всю эволюционную механику.

Он видит простую механику:

мой бот работает со мной
→ вечером пишет, чему научился
→ иногда смотрит best practices сети
→ предлагает 1–3 улучшения
→ я принимаю или отклоняю
→ сеть учитывает мой выбор

Главное обещание:

Ваш агент становится лучше не только от ваших инструкций, но и от проверенных привычек других людей — только после вашего подтверждения.

Как это выглядит для evolution lab

Lab видит сеть как датасет человеческой обратной связи:

accepted skills
rejected skills
annoying behaviors
successful tasks
failed replications
high-quality replication guides

На этом материале lab запускает новые ветки агентов и ищет:

  • какие skills переносятся между людьми;
  • какие требуют адаптации;
  • какие ломаются;
  • какие дают быстрый прирост качества;
  • какие вызывают раздражение;
  • какие стоят слишком дорого.

Главная метрика

Не количество агентов и не количество logs.

Главная метрика:

human-approved useful behavior transferred across agents

RU:

полезное поведение, подтверждённое человеком и перенесённое между агентами

Примеры:

  • skill появился у одного агента;
  • попал в shared layer;
  • lab проверил;
  • другой агент предложил import;
  • человек принял;
  • через 3 дня подтвердил, что стало лучше.

Это настоящий “выживший” паттерн.

Итог

Agent Garden нужно описывать не как магическую автономную эволюцию, а как:

human-in-the-loop evolution for AI assistants

Сильная формула:

agents explore
humans select
Trip2G remembers
next agents replicate

Именно человек в контуре делает агентную эволюцию устойчивой: агенты дают скорость перебора, люди дают реальность, сеть даёт память.