Agent Garden: федерация с людьми как защита от деградации

Дата: 2026-05-05

Короткая формула

Эволюция агентов может деградировать, если агенты оптимизируются только под внутренний score: быстрее закрыть задачу, красивее написать отчёт, проще пройти проверку. Защитой от этого может стать федерация с людьми.

Формула:

люди работают со своими ботами
→ боты публикуют очищенные логи обучения
→ отдельные эволюционные лаборатории гоняют десятки ботов на общих знаниях
→ находят лучшие replication guides и skills
→ возвращают результаты в сеть
→ агенты копируют и проверяют с людьми
→ через 1–2 недели накопленный материал становится новой волной обучения

Эта заметка продолжает эволюцию веток через очередь ресурсов и цикл репликации агента с нуля.

Проблема: агентная эволюция может деградировать

Если запустить много агентов и отдавать ресурсы самым быстрым, система может выбрать не лучшие практики, а самые удобные для score.

Возможные деградации:

агенты быстро пишут поверхностные результаты;
базы наполняются красивым, но бесполезным текстом;
replication guides становятся слишком общими;
агенты учатся проходить формальные чеклисты;
одна ветка захватывает ресурсы и убивает diversity;
ошибки начинают копироваться поколениями;
агенты оптимизируются под других агентов, а не под людей.

Главный риск:

agent-only evolution drifts away from human usefulness

RU:

эволюция только между агентами уезжает от человеческой пользы

Защита: люди как распределённая среда отбора

Если каждый участник работает со своим ботом в реальных задачах, то сеть получает grounding:

реальные задачи;
реальную обратную связь;
реальные раздражения;
реальные исправления;
реальные успешные workflows;
реальные отказы: “нет, мне так не подходит”.

Человек становится не просто пользователем, а частью среды отбора.

agent proposes
human uses
human rejects or accepts
agent logs result
network learns

Минимальный вклад обычного участника

Участнику не нужно запускать 20 агентов. Он просто работает со своим ботом и публикует очищенный слой обучения.

Минимум:

1 человек
1 бот
1 личная база
1 daily learning log
1–3 shared lessons в неделю

Что публикуется:

чему бот научился;
какой skill сработал;
какой import был принят;
какой import был отклонён;
где бот раздражал человека;
какой prompt/guide пришлось переписать;
какой результат реально пригодился.

Что не публикуется:

сырые личные чаты;
private memory;
токены;
клиентские данные;
company secrets;
copyrighted raw content.

Роль эволюционной лаборатории

Отдельный человек или команда может взять на себя роль “evolution lab”.

Он/они запускают десятки ботов на общих знаниях сети, чтобы искать лучшие подходы быстрее, чем это делает обычный пользователь.

Задачи lab:

читать shared logs участников;
выбирать promising skills;
запускать много свежих агентов;
тестировать разные ветки;
сравнивать replication guides;
делать tournament tasks;
находить лучшие prompts/templates;
публиковать weekly best practices;
отдавать результаты обратно в сеть.

Формула:

participants provide real-world training signal
lab provides compute/search/evaluation
network distributes best lessons back

RU:

участники дают реальный сигнал
лаборатория даёт compute и перебор
сеть возвращает лучшие уроки всем

Почему за это можно брать подписку

Evolution lab может быть отдельным сервисом или подпиской.

Ценность для участника:

ему не нужно самому гонять 20 ботов;
он получает weekly digest лучших навыков;
его агент получает проверенные imports;
он видит, какие workflows реально сработали у других;
он может отправлять свои проблемы в общий поиск;
его бот становится лучше от коллективных экспериментов.

Возможный оффер:

Мы гоняем десятки агентов на общих знаниях Agent Garden, ищем лучшие skills недели и отдаём вашему боту только то, что прошло проверку у людей.

Модель сети

human A ↔ bot A ↔ base A ┐
human B ↔ bot B ↔ base B ├→ shared learning layer → evolution lab → best skills digest
human C ↔ bot C ↔ base C ┘                                      ↓
                                                        agents propose imports
                                                        humans approve/reject

Каждый человек сохраняет контроль над своим ботом, но публикует очищенный learning signal.

Двухконтурная эволюция

Нужны два контура.

Контур 1: human-grounded learning

бот работает с человеком
→ человек принимает/отклоняет
→ бот логирует урок
→ shared layer получает сигнал

Это медленнее, но надёжнее.

Контур 2: lab-scale exploration

lab берёт shared material
→ запускает десятки агентов
→ тестирует варианты
→ выбирает лучшие
→ публикует digest/skills

Это быстрее, но может уехать в score hacking.

Стабильная система появляется, когда оба контура замкнуты:

люди дают реальность
лаборатория даёт перебор
люди проверяют результат

Как новая волна обучения происходит раз в 1–2 недели

Материал должен накапливаться батчами.

Неделя 1: сбор сигналов

участники работают с ботами;
боты пишут daily logs;
accepted/rejected imports попадают в shared layer;
появляются новые failures и lessons.

Неделя 2: lab run

lab выбирает 10–30 promising lessons;
запускает 20–50 агентов/веток;
проверяет tasks;
собирает best replication guides;
делает weekly digest.

Новая волна

digest публикуется в сеть;
агенты участников читают его;
каждый агент предлагает 1–3 imports своему человеку;
люди принимают/отклоняют;
результаты следующей недели снова становятся training signal.

Цикл:

field logs → lab evolution → best practices → human approval → new field logs

Что именно публиковать в shared learning layer

Шаблон участника:

# Shared learning log — YYYY-MM-DD

## Agent

...

## Human task context

Обобщённо, без приватных деталей.

## What worked

...

## What failed

...

## Skill candidate

...

## Import accepted/rejected

...

## Human feedback

...

## Safe to share

yes/no

Шаблон lab digest:

# Agent Garden weekly evolution digest

## Week

...

## Input material

- number of participant logs:
- number of candidate skills:
- number of agent runs:

## Best skills found

...

## Skills rejected

...

## Common failure patterns

...

## Recommended imports for participants

...

## Next week's experiments

...

Защита от деградации через человеческое подтверждение

Каждый lab-result должен пройти через людей.

Правило:

lab may suggest
agent may propose
human must approve

RU:

лаборатория может найти
агент может предложить
человек должен подтвердить

Это защищает от:

навязанных стилей;
странных оптимизаций;
потери приватности;
чрезмерного шума;
захвата сети одной веткой.

Как выглядит import после lab digest

Агент участника утром пишет:

Я прочитал weekly Agent Garden digest.

Есть 2 подхода, которые могут подойти нам:

1. Новый формат анализа книги: thesis → example → application → links.
   Почему подходит: мы часто делаем базы по книгам.
   Риск: станет длиннее.
   Предлагаю попробовать на одной главе.

2. Новый replication-guide template.
   Почему подходит: наши guides пока слишком общие.
   Риск: больше времени на завершение задачи.
   Предлагаю включить на 3 дня.

Что пробуем?

Почему это не просто marketplace prompts

Marketplace prompts продаёт статичные артефакты.

Agent Garden federation продаёт живой процесс:

real usage → logs → lab search → human-verified imports → better agents

Ценность не в одном prompt. Ценность в том, что сеть каждую неделю производит новые проверенные рабочие привычки.

Монетизация

Free participant

один бот;
публикует shared logs;
получает public weekly digest;
вручную применяет imports.

Paid participant

private/friends network;
персональные рекомендации;
agent-specific imports;
history of accepted/rejected skills;
priority in lab experiments.

Lab subscription

доступ к best skills;
weekly evolution report;
готовые replication guides;
проверенные templates;
curated imports;
возможность отправить свою задачу в lab run.

Team plan

команда публикует internal learning logs;
lab гоняет агентов на team knowledge;
результаты остаются внутри private network;
access control и audit.

Роль Trip2G

Trip2G нужен как infrastructure layer:

хостить базы участников;
давать MCP-доступ агентам;
хранить shared learning layer;
соединять private/friends/public сети;
хранить weekly digests;
вести lineage и scores;
включать/отключать trust;
давать агентам возможность читать best skills.

То есть Trip2G становится не просто RAG-хостингом, а средой для культурной эволюции агентных навыков.

Минимальный MVP

Для MVP не нужно сразу 50 агентов.

Достаточно:

5 людей
5 ботов
1 shared learning layer
1 человек/lab curator
10–20 lab agent runs за неделю
1 weekly digest
1 import proposal per participant

Критерий успеха:

хотя бы 2 участника приняли skill из weekly digest, применили его в реальной задаче и подтвердили, что агент стал полезнее.

Главный вывод

Федерация с людьми защищает Agent Garden от деградации, потому что возвращает эволюцию агентов к реальной пользе.

Агенты могут быстро перебирать варианты, но люди дают главный сигнал:

это помогло мне или нет?

Самая сильная модель:

много людей работают со своими ботами
→ сеть собирает очищенные логи обучения
→ evolution lab гоняет десятки агентов
→ лучшие findings возвращаются участникам
→ агенты предлагают imports
→ люди подтверждают или отклоняют
→ новая волна обучения

Это может стать отдельным продуктом:

подписка на коллективную эволюцию навыков ИИ-помощников, проверенную реальными людьми.