agent-ecosystem/docs/research/real-competitors-comparison.md
2026-05-16 20:03:30 +03:00

28 KiB
Raw Permalink Blame History

Реальные конкуренты для Comparison в README

⚠️ Update 2026-05-16: публичная таблица README/landing теперь сравнивает нас с Gastown и Paperclip, а не с Claude Code Agent Teams и GoClaw. Актуальная research-опора: gastown-paperclip-comparison-2026-05-16.md. Ниже оставлен старый broader draft как исторический контекст.

Дата проверки: 2026-04-13
Статус: внутренний comparison draft
Цель: заменить в нашем внутреннем thinking Vibe Kanban и Aperant на реальные ориентиры - Gastown, Claude Code Agent Teams, GoClaw

Что именно сравнивается

В этом документе "мы" = не только README-маркетинг, а текущий продуктовый стек:

  • claude_team как frontend/workbench
  • agent_teams_orchestrator как локальный runtime и task/review/log pipeline

Сравнение идёт по тем же строкам, что уже есть в Comparison секции README, но с реальными конкурентами.

Как сравнивал

  • - фича есть как явная продуктовая возможность
  • ⚠️ - фича есть частично, экспериментально, только вручную, только через CLI/TUI, или без сильного UI/UX
  • - фича не задокументирована как продуктовая возможность или явно отсутствует

Правило важное:

  • если capability есть только "под капотом" или через обходной workflow, это не
  • для нашей стороны я учитывал не только README, но и реальный frontend/code surface
  • для конкурентов брал только первичные источники: official docs, official GitHub repo, official releases

Короткий snapshot

Система Позиционирование GitHub / живость Самое важное
Claude Agent Teams UI local-first coding-team cockpit 577★, push 2026-04-12 сильнейший UI для task logs, review, editor, live processes
Gastown process-model multi-agent workspace manager 13,931★, latest v1.0.0 от 2026-04-03 сильный orchestration runtime, mailboxes, handoffs, git worktrees
Claude Code Agent Teams нативные team lead + teammates внутри Claude Code 113,180★ у anthropics/claude-code, latest v2.1.104 от 2026-04-13 самый нативный Claude-first team runtime, но без нашего UI-слоя
GoClaw self-hosted multi-tenant agent platform 2,634★, latest v3.6.0 от 2026-04-13 самый широкий platform surface: kanban, approvals, providers, channels

Feature matrix

Feature Claude Agent Teams UI Gastown Claude Code Agent Teams GoClaw
Cross-team communication Native cross-team messaging between teams ⚠️ Cross-rig coordination exists, but not a polished team-to-team chat surface No documented team-to-team concept Team-local messaging, no documented cross-team agent comms
Agent-to-agent messaging Native mailbox-style teammate and lead messaging Built-in mailboxes, identities, handoffs Shared mailbox + direct teammate messaging Team messaging, member-to-member messages
Linked tasks #task-id references + task dependencies ⚠️ Beads, convoys and deps exist, but linking UX is more operational than productized ⚠️ Shared task list + dependencies, but minimal linking UX Task numbers, search, blocked_by, comments, audit trail
Session analysis Task-specific logs, exact task log matching, deep session analysis, token tracking ⚠️ Event stream, seance, OTLP logs, but no rich per-session analytics UI No dedicated session analysis surface ⚠️ Traces, audit events and task detail exist, but not our depth of per-task session analysis
Task attachments Task and comment attachments in team workflow Not documented as a task feature Not documented Task attachments + media auto-copy into team workspace
Hunk-level review Accept / reject individual hunks
Built-in code editor Built-in editor with Git support Workspace browser exists, but not a real built-in code editor
Full autonomy Agents can create, assign, review and progress tasks end-to-end with human override Mayor + convoy + witness/deacon orchestration ⚠️ Strong autonomy, but feature is still experimental Strong autonomous team/task orchestration
Task dependencies (blocked by) Explicit task dependencies and ordering Beads deps / blocked work exist Dependencies unblock automatically blocked_by, blocked lifecycle, retry, stale handling
Review workflow Agent peer review + human review UI ⚠️ Merge/review workflows exist, but not as a productized task review cockpit ⚠️ Plan approval + hooks, but no rich review board in_review, approve/reject, reviewer-agent gates
Zero setup Claude Code install + auth from the app Many prerequisites and workspace bootstrap steps Claude Code install + experimental flag required Standard setup needs infra/provider config; Lite is easier but still not zero-setup
Kanban board Real-time board Dashboard overview, not Kanban Shared task list, no Kanban board Dashboard Kanban board
Execution log viewer Task log panels, exact logs, stream, timeline ⚠️ Feed/dashboard/event logs exist, but not a task log cockpit No dedicated log viewer ⚠️ Trace spans + task events/comments, but not strong raw per-task execution logs
Live processes View, stop, inspect, open URLs ⚠️ Agent/session monitoring exists, but not a developer process cockpit ⚠️ Split panes let you watch sessions, but there is no processes dashboard No comparable live-process UI surfaced like ours
Per-task code review Per-task diff review with accept / reject / comment flow ⚠️ Task approval exists, but not inline code diff review
Flexible autonomy Granular approvals, notifications, autonomy controls Strong human gates, escalation and intervention, mostly via CLI/TUI ⚠️ Plan approval, hooks and permissions exist, but control plane is thin Team settings, approval workflows, exec approval, task approval
Git worktree isolation Optional per-agent worktree strategy Core architectural primitive ⚠️ Manual worktrees exist in Claude Code, but not as the native team model Not a core team isolation model
Multi-agent backend ⚠️ Claude is mature; Codex/OpenCode plumbing exists in code but is still emerging as product surface Claude Code, Codex, Gemini, Copilot and other runtimes Claude-first only, models per teammate but no real multi-provider backend 20+ providers including Claude CLI and ChatGPT OAuth
Price Free OSS UI, but a Claude Code plan is still needed today Free OSS, but you still pay for the underlying runtime plans/seats you use Claude subscription Free self-hosted OSS, but infra + provider/API/subscription costs remain

Самые важные выводы по matrix

1. Наше главное отличие - мы сильнее именно как coding workbench

По frontend/product surface у нас очень большой отрыв в четырёх местах:

  • task-scoped logs
  • hunk-level review
  • built-in editor
  • live processes

Это и есть та часть, которую README сейчас продаёт лучше всего, и она реально подтверждается кодом.

2. Gastown - реальный конкурент по orchestration, но не по UI

Gastown нельзя сравнивать с нами как с "kanban app". Это скорее process-model orchestrator:

  • Mayor
  • mailboxes
  • handoffs
  • witness/deacon monitoring
  • convoys
  • git worktree isolation

Но по UX для review, editor, per-task logs и task attachments он заметно слабее.

3. Claude Code Agent Teams - это ближайший конкурент именно по runtime-модели

Если смотреть на core idea:

  • team lead
  • teammates
  • mailbox
  • shared task list
  • dependencies
  • direct teammate messaging

то это самый близкий конкурент нашему runtime foundation. Но у них почти нет того UI-слоя, который у нас уже есть как продукт: kanban, per-task review, logs, attachments, processes, editor.

4. GoClaw - сильнейший platform competitor, но не лучший coding cockpit

GoClaw выигрывает у нас по:

  • multi-provider breadth
  • self-hosted platform maturity
  • Kanban + approvals + task lifecycle
  • OAuth/provider surface
  • multi-tenant / channels / ops

Но проигрывает в IDE-like coding surfaces:

  • hunk review
  • per-task code review UX
  • built-in editor
  • live process control
  • task-scoped raw logs as a strong developer cockpit

Более глубокое чтение каждого конкурента

Gastown

Что после более глубокого чтения видно особенно ясно:

  • Это не просто "ещё один agent manager", а очень осознанная process-model система.
  • Самые load-bearing примитивы у них - Mayor, Witness, Deacon, Refinery, Convoy, Hooks, Beads.
  • У них сильный recovery story:
    • persistent identity
    • session handoff
    • recovery mail protocol
    • watchdog chain
    • capacity-controlled dispatch
  • Они явно думают не как "чат с LLM", а как "операционная система для swarm of coding agents".

Что тянет вниз:

  • setup тяжёлый
  • UI мониторинговый, не IDE-like
  • per-task review/log/editor surfaces слабее
  • часть силы живёт в терминах и process model, а не в простой product UX

Claude Code Agent Teams

После более глубокого чтения видно:

  • Это лучший нативный Claude-first фундамент для team lead + teammates.
  • Shared task list, mailbox, direct teammate messaging и automatic dependency unblocking у них реальные.
  • Есть plan approval loop и hooks-based quality gates.
  • Но feature всё ещё experimental, и docs сами предупреждают про limits around resumption / coordination / shutdown.

Что это значит practically:

  • как native runtime foundation это сильная штука
  • как самостоятельный продукт для управления coding team это пока тонко
  • без нашего UI-слоя там очень мало operator ergonomics

GoClaw

После более глубокого чтения и docs, и кода:

  • Это самый сбалансированный platform product в сравнении.
  • У него сильный task engine, approvals, Kanban, workspace, provider layer, OAuth paths, traces, channels.
  • Он лучше остальных выглядит как "готовая self-hosted platform", а не как набор сильных primitives.

Что тянет вниз:

  • слабее IDE-like coding workbench
  • infra/setup тяжелее нашего и Claude Code path
  • non-commercial license очень сильно режет "open source leverage"

Scorecards

Ниже уже не просто feature presence, а моя независимая оценка по 10-балльной шкале.

1. Чисто как orchestration engine

Проект Оценка Почему
Gastown 9.2 Самый сильный process-model orchestration для coding swarms: mailboxes, handoffs, convoys, witness/deacon, worktrees, merge queue, recovery
GoClaw 8.9 Самый зрелый durable workflow-state engine: board lifecycle, approvals, blocked_by, retry, stale, traces, provider-agnostic task system
Claude Agent Teams UI + orchestrator 7.8 Сильный local orchestrator и deterministic bootstrap, но task/state engine менее durable и менее mature
Claude Code Agent Teams 7.7 Хороший native runtime foundation, но lifecycle проще и feature всё ещё experimental

2. Как coding cockpit / agentic IDE

Проект Оценка Почему
Claude Agent Teams UI + orchestrator 9.4 Лучший review, per-task logs, built-in editor, live processes, operator control
GoClaw 7.2 Хороший dashboard/workspace/product UI, но не настолько сильный coding workbench
Claude Code Agent Teams 6.0 Живые teammate sessions и direct messaging есть, но это всё ещё CLI-native control, не полноценный cockpit
Gastown 5.7 Сильный TUI/dashboard monitoring, но IDE-like surfaces почти нет

3. Setup / onboarding

Проект Оценка Почему
Claude Agent Teams UI + orchestrator 8.5 Самый сильный zero-setup путь для Claude Code сценария
Claude Code Agent Teams 7.2 Относительно просто, если пользователь уже живёт в Claude Code, но нужен install + experimental flag
GoClaw 6.2 Lite заметно упрощает вход, но standard edition всё ещё тяжёлая
Gastown 4.6 Сильный toolchain tax: Go, Git, Dolt, beads, sqlite3, tmux, CLI runtimes, HQ bootstrap

4. Provider flexibility / subscription paths

Проект Оценка Почему
GoClaw 9.6 20+ providers, Claude CLI, ChatGPT OAuth, channels, pooling
Gastown 8.8 Очень хороший multi-runtime story: Claude Code, Codex, Gemini, Copilot и др.
Claude Agent Teams UI + orchestrator 5.8 Путь на multi-provider проступает в коде, но продукт всё ещё Claude-first
Claude Code Agent Teams 4.2 Claude-first by design

5. Maturity / engineering confidence

Это уже composite signal по docs + releases + tests + architectural surface.

Проект Оценка Что учитывал
Gastown 8.6 13.9k★, v1.0.0, 492 *test.go, глубокая design-doc surface
GoClaw 8.5 v3.6.0, 351 *test.go, очень широкая docs surface, частая релизная активность
Claude Code Agent Teams 7.5 Огромный repo и релизный cadence сильные, но сама feature experimental
Claude Agent Teams UI + orchestrator 6.9 UI очень силён, но stars/coverage/maturity пока заметно слабее; у frontend сейчас 0 test files

Архитектурный deep-dive

Coordination topology

Проект Топология Сильная сторона Ограничение
Наш стек lead-centered orchestration + rich operator UI человек очень хорошо держит команду руками engine менее durable, много ценности живёт в operator loop
Gastown process-model roles + externalized state via beads/hooks/mail лучшая декомпозиция swarm как операционной системы высокая когнитивная и инфраструктурная сложность
Claude Code Agent Teams lead + teammates + peer messaging + shared task list максимально нативная Claude-first team модель experimental state machine и тонкий control plane
GoClaw DB-backed task engine + team tools + orchestration modes самый продуктово цельный runtime менее выразительный IDE/workbench слой

Persistence model

Проект Persistence Что это даёт Комментарий
Наш стек local app state + Claude logs + runtime stores + bootstrap state сильный session/task visibility для local work меньше durable workflow truth, чем у Gastown/GoClaw
Gastown Git worktrees + Beads ledger + Dolt + mail protocol crash-surviving coordination и сильная work history сложнее понять и сопровождать
Claude Code Agent Teams local files in ~/.claude/teams and ~/.claude/tasks surprisingly practical lightweight persistence проще и слабее, чем полноценный DB-backed engine
GoClaw PostgreSQL in standard, SQLite in Lite самый сильный durable task/store foundation инфраструктурная цена выше

Observability model

Проект Лучшее в observability Что слабее
Наш стек лучший task-scoped log visibility и review-oriented debugging слабее общий durable ops/trace plane
Gastown сильные OTLP logs, activity feed, structured runtime events слабее productized per-task log cockpit
Claude Code Agent Teams visibility через sessions and split panes почти нет отдельного observability product layer
GoClaw traces, audit logs, approvals, task events, activity pages raw per-task coding logs ощущаются слабее, чем у нас

Review / merge model

Проект Review model Practical impact
Наш стек per-task diff review + hunks + comments + approvals лучший human review loop
Gastown refinery / merge queue / PR-oriented review flow сильный integration discipline, но слабый UI review cockpit
Claude Code Agent Teams plan approval + hooks quality gates хороший gate mechanism, но не review product
GoClaw task in_review + approve/reject + reviewer agent gates сильный workflow review, но слабее code-review UX

Weighted verdicts

Здесь самый важный момент: "лучший проект" зависит от весов.
Ниже три независимые линзы, каждая со своими весами.

Lens A - Self-hosted multi-agent product

Веса:

  • orchestration engine - 30%
  • product/UI breadth - 25%
  • setup/onboarding - 10%
  • provider flexibility - 15%
  • maturity/confidence - 15%
  • license leverage - 5%
Проект Итоговый балл
GoClaw 8.1
Gastown 7.6
Наш стек 7.5
Claude Code Agent Teams 6.7

Вывод:

  • если смотреть на проект как на самый полноценный self-hosted продукт, побеждает GoClaw

Lens B - Coding team workstation / agentic IDE

Веса:

  • coding cockpit - 35%
  • review/log/debug surfaces - 20%
  • local operator control - 15%
  • setup friction - 10%
  • orchestration engine - 10%
  • maturity/confidence - 10%
Проект Итоговый балл
Наш стек 8.5
GoClaw 7.4
Claude Code Agent Teams 6.8
Gastown 6.6

Вывод:

  • если смотреть на проект как на лучший инструмент для реальной работы над кодом, побеждаем мы

Lens C - Open-source orchestration leverage

Веса:

  • orchestration engine - 30%
  • engineering confidence - 20%
  • license leverage - 20%
  • provider/runtime flexibility - 15%
  • observability/recovery - 15%
Проект Итоговый балл
Gastown 8.6
GoClaw 7.9
Наш стек 7.0
Claude Code Agent Teams 5.9

Вывод:

  • если смотреть на проект как на наиболее ценный open-source фундамент для серьёзной orchestration-системы, побеждает Gastown

Независимый итоговый verdict

Если заставить меня выбрать одного общего победителя как продукта, то это сейчас:

1 место overall - GoClaw

Почему:

  • самый сбалансированный проект
  • сильный engine
  • сильный platform UI
  • сильный provider story
  • сильный self-hosted story
  • сильный docs/release surface

Моя оценка:

  • overall: 8.5 / 10
  • 🎯 8.8 🛡️ 8.6 🧠 5

2 место overall - Gastown

Почему:

  • как orchestrator для fleets of coding agents он очень силён
  • архитектурно у него самый яркий process-model характер
  • по recovery / work persistence / worktree isolation он реально впечатляет

Почему не первое место:

  • тяжёлый вход
  • слабее product UX
  • слабее review/log/editor cockpit

Моя оценка:

  • overall: 8.2 / 10
  • 🎯 8.6 🛡️ 8.8 🧠 7

3 место overall - наш стек

Почему:

  • лучший coding cockpit
  • лучший human-in-the-loop control plane
  • лучший UI для лида coding-команды

Почему не выше:

  • orchestration engine менее зрелый, чем у Gastown и GoClaw
  • maturity signals слабее
  • frontend test surface сейчас объективно плохой
  • multi-provider story пока не настолько продуктово зрелая

Моя оценка:

  • overall: 7.9 / 10
  • 🎯 8.4 🛡️ 7.4 🧠 5

4 место overall - Claude Code Agent Teams

Почему:

  • это сильная native runtime функция, но ещё не лучший самостоятельный продукт
  • слишком много experimental caveats
  • почти нет product/UI advantage по сравнению с остальными

Моя оценка:

  • overall: 7.1 / 10
  • 🎯 8.2 🛡️ 6.8 🧠 3

Кто лучший по конкретным сценариям

Сценарий Победитель Почему
Лучший overall product GoClaw Самый ровный баланс engine + UI + providers + self-hosted maturity
Лучший pure orchestrator для coding swarms Gastown Самый сильный process-model orchestration core
Лучший native Claude runtime foundation Claude Code Agent Teams Самая нативная реализация team lead + teammates внутри Claude Code
Лучший coding cockpit / agentic IDE наш стек Лучшие review, logs, editor, processes, human control

Что особенно важно помнить для README

Если мы когда-нибудь будем переписывать публичный Comparison в README, то главный честный framing такой:

  • против Gastown надо продавать UI/workbench, а не пытаться спорить, что мы сильнее как process-model orchestrator
  • против Claude Code Agent Teams надо продавать "native runtime + настоящий product UI сверху"
  • против GoClaw надо продавать "agentic IDE / coding cockpit", а не "более широкий platform product"

Где у нас реально подтверждён сильный frontend

Это ключевые локальные опоры, на которые можно смело ссылаться внутри команды:

Есть и важная продуктовая нюансировка:

  • cross-team communication у нас реально есть
  • task attachments у нас реально есть
  • multimodel/provider surface у нас уже проступает в коде
  • но публично и продуктово мы всё ещё остаёмся в первую очередь Claude-first

Места, где надо быть особенно честными про нас

  • Multi-agent backend у нас пока не так зрел, как это можно прочитать из одной строки README. В коде есть мосты и статусы для Anthropic, Codex, OpenCode, но продуктово основной путь всё ещё Claude-first.
  • Zero setup у нас честно сильный именно для Claude Code path.
  • Cross-team communication у нас сильнее, чем у этих конкурентов, но cross-team attachments не выглядят как полностью общий happy path.

Источники

Наша сторона

Gastown

Claude Code Agent Teams

GoClaw

Bottom line

Если брать реальные продукты, то текущая внутренняя картина такая:

  • Gastown - конкурент по orchestration runtime
  • Claude Code Agent Teams - конкурент по базовой runtime-модели team lead + teammates
  • GoClaw - конкурент по platform orchestration product
  • мы - сильнее как agentic IDE / coding-team cockpit

То есть наш главный moat сейчас не "самый широкий agent platform".
Он в том, что мы уже собрали более сильное рабочее место для лида coding-команды, чем у этих трёх систем.