ParallelClaw MVP v3

Execution layer для OpenClaw: 4 паттерна параллелизма,
доказанные экспериментами и наукой.

4 недели Talk While Work ✅ Ready Multi-Mind · Multi-Shard · Multi-Agent

Четыре паттерна параллелизма

Не один «параллелизм» — четыре разных паттерна с разной экономикой. Пользователь думает задачами, мы выбираем паттерн.

Pattern 1 ✅ Ready

Talk While Work

Self-delegation: агент сам решает — ответить напрямую или spawn sub-agent. Routing rules в AGENTS.md. Самый простой.

Pattern 2

Multi-Mind

/pc-ask — N моделей одновременно, majority voting. Consensus для критичных решений. +17.9% GSM8K.

Pattern 3

Multi-Shard

/pc-scan — Sharded throughput. Stateless HTTP parallel calls. 43× speedup на batch-задачах.

Pattern 4

Multi-Agent

/pc-do — Декомпозиция в stateful sub-agents с tools. Stanford: 7B бьёт 671B через специализацию.

Ключевое: Talk While Work — полноценный паттерн, не "foundation layer". Все четыре паттерна независимы, можно использовать любой без остальных.

Pattern 1: Talk While Work ✅ Ready

Self-delegation через AGENTS.md — агент решает: fast reply или spawn sub-agent для тяжёлой работы.

Как работает

  • Устанавливается как OpenClaw skill: talk-while-work
  • install.py добавляет routing section в AGENTS.md
  • Система вшивает routing rules прямо в system prompt агента
  • Агент получает 70+ примеров routing-решений
  • Перед каждым ответом: direct reply vs sessions_spawn

Что внутри .skill файла

  • routing-examples.md — 70+ примеров (привет → direct, «сделай бота» → spawn)
  • requirements.md — 3 tier: Hobby / Pro / Power
  • parallelclaw-patterns.md — описание всех 4 паттернов
  • Routing работает immediately, zero config
  • True parallelism требует config check: RPM, maxChildrenPerAgent

Direct reply (main agent)

Приветствия, переводы, простые вопросы, объяснения концепций, дебаг одного контекста. Быстро, дёшево, без overhead'а.

Delegate (sub-agent)

Генерация кода, web research, артефакты (презентации, отчёты), multi-step бизнес-задачи. Тяжёлая работа уходит в фон.

Routing rules (few-shot examples): «привет» → direct · «переведи» → direct · «сделай бота» → spawn · «сравни 5 БД» → spawn · «почему тормозит» → direct · «нужен скрипт» → spawn

Pattern 2: Multi-Mind · /pc-ask

Consensus voting — один промпт в N моделей одновременно, majority voting, judge synthesis.

Механика

  • 1 промпт → N моделей параллельно (3-6)
  • Каждая модель отвечает независимо
  • Majority voting для closed-form вопросов
  • LLM-judge synthesis для open-ended
  • Стоимость ×N, время ≈ 1 модель

Use cases

  • Архитектурные решения (4 мнения → консенсус)
  • Code review (3 модели, 2 должны agree на проблему)
  • Legal / compliance check
  • Когда цена ошибки высока

Science: Self-Consistency (Wang et al.) — несколько reasoning paths + majority voting = +17.9% GSM8K, +11.0% SVAMP. Debate vs Voting (arxiv 2508.17536): majority voting объясняет почти весь прирост quality, debate в 3× дороже и не сильно лучше.

Честно: Multi-Mind — самый дорогой паттерн на один запрос. На одну Multi-Mind задачу приходится 20-50 Multi-Shard задач в реальной работе. Не злоупотребляйте.

Pattern 3: Multi-Shard · /pc-scan

Sharded throughput — N кусков работы в параллельные stateless HTTP-вызовы.

Механика

  • N независимых кусков → параллельные HTTP direct к API
  • Stateless (без сессии, без tools) — максимальная скорость
  • N = 50-5000 одновременно
  • AIMD adaptive concurrency: старт 20, 429 → ÷2, без 429 → +5
  • Стоимость по объёму, время ÷N

Use cases

  • 80 страниц PDF → суммаризация (8.2s vs 4 min)
  • 500 отзывов → sentiment analysis
  • 200 файлов → code review batch
  • Массовый translation / classification

Economics: 87 pages via Haiku = $0.17, 8.2s vs 4 min sequential. 43× speedup. Самый недооценённый паттерн. Batch processing revolution.

Почему HTTP direct, не sub-agents: 10 HTTP-запросов = 26 сек. 10 субагентов = 2-3 мин. Sub-agent overhead (15-18s init) убивает throughput. HTTP direct в 7.5× быстрее.

Pattern 4: Multi-Agent · /pc-do

Декомпозиция сложной задачи в N полноценных stateful sub-agents с tools, контекстом и памятью.

Механика

  • Задача → план → N sub-agent'ов с ролями
  • Stateful: tools, контекст, файловая система
  • N = 3-10 (ограничено overhead'ом)
  • Reducer собирает и синтезирует результаты
  • Дорогой, мощный, для глубокой работы

Пример: Due Diligence

  • Agent 1: Финансы и метрики
  • Agent 2: Команда и основатели
  • Agent 3: Конкуренты и рынок
  • Agent 4: Технология и IP
  • Agent 5: Юридические риски
  • Merge → итоговый отчёт

Science: Stanford Self-Play (arXiv:2604.20209) — 7B модель обыграла 671B DeepSeek-Prover-V2 через 3-agent specialization (Solver + Conjecturer + Guide). Доказательство: parallel specialization beats monolithic scale.

Что доказали экспериментами

Реальные цифры из этого чата. Измерено на HydraGPT + OpenClaw.

Скорость

10 субагентов параллельно за 4.2 сек. Wall-clock ускорение 3.7× vs последовательного. 8/10 вернули результаты.

Overhead

Фиксированный overhead на субагента: 15-18 сек (инициализация + планирование). Для простых задач overhead превышает полезную работу.

HTTP Direct vs Sub-agents

10 HTTP-запросов: 26 сек. 10 субагентов: 2-3 мин. HTTP direct в 7.5× быстрее → Smart routing обязателен.

Model Override Bug

model="..." в sessions_spawn игнорируется. Система выбирает из fallback chain. Workaround: pool-based round-robin.

Thread Binding

Persistent sub-agents в Telegram direct невозможны. Субагенты = fire-and-forget background workers, не chat companions.

Tools в Sub-agents

Субагенты могут использовать web_search, exec, read, write. Проверено. Вопреки GitHub issues.

Вывод: Smart routing обязателен. Простые задачи (<30 сек) → HTTP direct. Сложные (research, code gen, file ops) → sub-agents с tools. Model override bug требует pool-based routing.

Научное обоснование

Не маркетинг. Конкретные цифры из peer-reviewed работ.

Self-Consistency

Несколько reasoning paths + majority voting. +17.9% GSM8K, +11.0% SVAMP vs single-path. ParallelClaw: /pc-ask prompt --models 5.

Tree-of-Thought

Параллельное исследование путей лучше single-chain для сложных задач. /pc-do task --branches 3 --depth 2.

LLMxMapReduce

Naive chunking → aggregator noise. Хороший MapReduce требует structured outputs (evidence + confidence) + intelligent reduce.

Stanford Self-Play

7B бьёт 671B через 3-agent specialization. Доказательство: parallel specialization beats monolithic scale.

Debate vs Voting (arxiv 2508.17536): Majority voting объясняет почти весь прирост quality. Debate в 3× дороже и не сильно лучше. Fan-out + voting = default. Debate только для adversarial use cases.

Архитектура и ограничения

Честно: что работает, что нет, и почему это не убивает продукт.

ОграничениеWorkaroundКоммуникация
Model override bugPool-based round-robin«Любая доступная из конфига»
Thread binding unavailableFire-and-forget subagents«Background workers»
Sub-agent overhead 15-18sHTTP direct для простых задач«Parallel для 3+ subtasks»
Sequential внутри сессииMultiple sessions«Несколько сессий для true parallel»

Слой 1: Skills

Markdown инструкции + slash-команды. Zero infrastructure, open source. /pc-ask, /pc-scan, /pc-do.

Слой 2: MCP-server

Key vault, cost ledger, connection pool (AIMD), кэш запросов. Observability и cost control.

Слой 3: Adaptive Routing

Thompson sampling bandit. Персональный benchmark. Warm-start из агрегированных priors всех пользователей.

Установка Talk While Work ✅ Ready

Готовый skill, упакован в .skill файл. Работает через AGENTS.md.

1

Установка

Установить skill talk-while-work — install.py добавляет routing section в AGENTS.md.

2

Zero config — routing сразу

System prompt получает 70+ примеров: когда direct, когда spawn. Работает immediately.

3

Config check для parallelism

True parallelism требует: RPM лимиты моделей, maxChildrenPerAgent в gateway config.

4

3 tier: Hobby / Pro / Power

Hobby: 1 модель, sequential fallback. Pro: multi-model pool. Power: adaptive routing + bandit.

Ключевое отличие от остальных паттернов: Talk While Work — это pattern внутри самого агента (self-delegation). Multi-Mind/Shard/Agent — patterns для внешнего orchestration. Разные уровни, не иерархия.

Клиентский путь: 7 актов

От лендинга до ежедневного использования.

1

Лендинг

GIF: /pc-ask → 4 мнения + голосование. Copy install command.

2

Установка

claude plugin install parallelclaw — 10-15s. Wizard: авто-детект API ключей.

3

Первый wow: /pc-ask

4 модели, голосование, синтез. $0.018, 5.2s. Mass intelligence — невозможно в Cursor или ChatGPT.

4

Второй wow: /pc-scan

87 страниц PDF за 8.2s. Batch processing revolution.

5

Ежедневное

/pc-ask для важных решений, /pc-scan для batch, /pc-do для deep research.

6

/pc-stats

Сохранённое время, win-rate, cost breakdown. Видимая ценность.

7

Adaptive Routing

После 100 вызовов — предложение включить bandit. «Для Go-кода вы выбираете Sonnet в 73%».

MVP: 4 недели

Честный scope. Каждая неделя — deliverable для пользователя.

Нед 1

Foundation: примитивы + инфра

Provider detection + wizard + keychain vault. pc.consensus, pc.shard, pc.compose. Skills /pc-ask, /pc-scan, /pc-do. SQLite cost ledger. Лендинг с GIF.

Нед 2

Business Templates: Due Diligence Light

/pc-dd "Company" — 7 веток, все 3 оркестрационных паттерна. /pc-compete, /pc-research. YAML definitions. Benchmark verification.

Нед 3

Polish: ошибки, retry, community

Retry с exponential backoff + graceful degradation. CONTRIBUTING.md + architecture.md. GitHub labels. Demo video 30 сек. ClawHub publication.

Нед 4

Launch: первые пользователи

HN / Reddit / Habr launch. Outreach к adjacent tool authors. 5 design partners. Install-to-first-value < 10 min. /pc-stats MVP.

Бизнес-модель + Go/No-Go

Честная монетизация и жёсткое решение через 4 недели.

Монетизация: 3 ступени

Stage 1: OSS Wedge — plugin + core lib. Бесплатно. Brand, trust, adoption.

Stage 2: ParallelClaw Cloud — hosted orchestrator, BYOK. $10-50/мес/команда.

Stage 3: Personal Agent Layer — Local Memory + Foreman + ParallelClaw. Продукт, не токены.

Что НЕ делаем

Комиссию поверх OpenRouter (маржа крошечная, BYOK обходит). Не строим свой gateway — OpenRouter уже сделал тяжёлую часть. Мы — оркестратор поверх.

Продолжаем если ✅

  • >2× speedup на /pc-scan
  • >90% reliability (0 silent failures / 50 runs)
  • 20-30% perceived quality improvement
  • 2 design partners за 4 недели
  • Install-to-first-value < 10 min

Закрываем если ❌

  • Нет стабильного 2× speedup
  • Нет 2 design partners
  • OpenClaw core выпускает native parallel
  • Model override bug не workaround'ается

Ссылки и ресурсы

ParallelClaw MVP v3 · 4 недели до первых пользователей · parallelclaw.ai

1 / 14