ParallelClaw MVP v3

Execution layer для OpenClaw: 4 паттерна параллелизма,
доказанные экспериментами и наукой.

4 недели Talk While Work ✅ Ready Multi-Mind · Multi-Shard · Multi-Agent

Четыре паттерна параллелизма

Не один «параллелизм» — четыре разных паттерна с разной экономикой. Пользователь думает задачами, мы выбираем паттерн.

Pattern 1 ✅ Ready

Talk While Work

Self-delegation: агент сам решает — ответить напрямую или spawn sub-agent. Routing rules в AGENTS.md. Самый простой.

Pattern 2

Multi-Mind

/pc-ask — N моделей одновременно, majority voting. Consensus для критичных решений. +17.9% GSM8K.

Pattern 3

Multi-Shard

/pc-scan — Sharded throughput. Stateless HTTP parallel calls. 43× speedup на batch-задачах.

Pattern 4

Multi-Agent

/pc-do — Декомпозиция в stateful sub-agents с tools. Stanford: 7B бьёт 671B через специализацию.

Ключевое: Talk While Work — полноценный паттерн, не "foundation layer". Все четыре паттерна независимы, можно использовать любой без остальных.

Pattern 1: Talk While Work ✅ Ready

Self-delegation через AGENTS.md — агент решает: fast reply или spawn sub-agent для тяжёлой работы.

Как работает

Устанавливается как OpenClaw skill: talk-while-work
install.py добавляет routing section в AGENTS.md
Система вшивает routing rules прямо в system prompt агента
Агент получает 70+ примеров routing-решений
Перед каждым ответом: direct reply vs sessions_spawn

Что внутри .skill файла

routing-examples.md — 70+ примеров (привет → direct, «сделай бота» → spawn)
requirements.md — 3 tier: Hobby / Pro / Power
parallelclaw-patterns.md — описание всех 4 паттернов
Routing работает immediately, zero config
True parallelism требует config check: RPM, maxChildrenPerAgent

Direct reply (main agent)

Приветствия, переводы, простые вопросы, объяснения концепций, дебаг одного контекста. Быстро, дёшево, без overhead'а.

Delegate (sub-agent)

Генерация кода, web research, артефакты (презентации, отчёты), multi-step бизнес-задачи. Тяжёлая работа уходит в фон.

Routing rules (few-shot examples): «привет» → direct · «переведи» → direct · «сделай бота» → spawn · «сравни 5 БД» → spawn · «почему тормозит» → direct · «нужен скрипт» → spawn

Pattern 2: Multi-Mind · /pc-ask

Consensus voting — один промпт в N моделей одновременно, majority voting, judge synthesis.

Механика

1 промпт → N моделей параллельно (3-6)
Каждая модель отвечает независимо
Majority voting для closed-form вопросов
LLM-judge synthesis для open-ended
Стоимость ×N, время ≈ 1 модель

Use cases

Архитектурные решения (4 мнения → консенсус)
Code review (3 модели, 2 должны agree на проблему)
Legal / compliance check
Когда цена ошибки высока

Science: Self-Consistency (Wang et al.) — несколько reasoning paths + majority voting = +17.9% GSM8K, +11.0% SVAMP. Debate vs Voting (arxiv 2508.17536): majority voting объясняет почти весь прирост quality, debate в 3× дороже и не сильно лучше.

Честно: Multi-Mind — самый дорогой паттерн на один запрос. На одну Multi-Mind задачу приходится 20-50 Multi-Shard задач в реальной работе. Не злоупотребляйте.

Pattern 3: Multi-Shard · /pc-scan

Sharded throughput — N кусков работы в параллельные stateless HTTP-вызовы.

Механика

N независимых кусков → параллельные HTTP direct к API
Stateless (без сессии, без tools) — максимальная скорость
N = 50-5000 одновременно
AIMD adaptive concurrency: старт 20, 429 → ÷2, без 429 → +5
Стоимость по объёму, время ÷N

Use cases

80 страниц PDF → суммаризация (8.2s vs 4 min)
500 отзывов → sentiment analysis
200 файлов → code review batch
Массовый translation / classification

Economics: 87 pages via Haiku = $0.17, 8.2s vs 4 min sequential. 43× speedup. Самый недооценённый паттерн. Batch processing revolution.

Почему HTTP direct, не sub-agents: 10 HTTP-запросов = 26 сек. 10 субагентов = 2-3 мин. Sub-agent overhead (15-18s init) убивает throughput. HTTP direct в 7.5× быстрее.

Pattern 4: Multi-Agent · /pc-do

Декомпозиция сложной задачи в N полноценных stateful sub-agents с tools, контекстом и памятью.

Механика

Задача → план → N sub-agent'ов с ролями
Stateful: tools, контекст, файловая система
N = 3-10 (ограничено overhead'ом)
Reducer собирает и синтезирует результаты
Дорогой, мощный, для глубокой работы

Пример: Due Diligence

Agent 1: Финансы и метрики
Agent 2: Команда и основатели
Agent 3: Конкуренты и рынок
Agent 4: Технология и IP
Agent 5: Юридические риски
Merge → итоговый отчёт

Science: Stanford Self-Play (arXiv:2604.20209) — 7B модель обыграла 671B DeepSeek-Prover-V2 через 3-agent specialization (Solver + Conjecturer + Guide). Доказательство: parallel specialization beats monolithic scale.

Что доказали экспериментами

Реальные цифры из этого чата. Измерено на HydraGPT + OpenClaw.

Скорость

10 субагентов параллельно за 4.2 сек. Wall-clock ускорение 3.7× vs последовательного. 8/10 вернули результаты.

Overhead

Фиксированный overhead на субагента: 15-18 сек (инициализация + планирование). Для простых задач overhead превышает полезную работу.

HTTP Direct vs Sub-agents

10 HTTP-запросов: 26 сек. 10 субагентов: 2-3 мин. HTTP direct в 7.5× быстрее → Smart routing обязателен.

Model Override Bug

model="..." в sessions_spawn игнорируется. Система выбирает из fallback chain. Workaround: pool-based round-robin.

Thread Binding

Persistent sub-agents в Telegram direct невозможны. Субагенты = fire-and-forget background workers, не chat companions.

Tools в Sub-agents

Субагенты могут использовать web_search, exec, read, write. Проверено. Вопреки GitHub issues.

Вывод: Smart routing обязателен. Простые задачи (<30 сек) → HTTP direct. Сложные (research, code gen, file ops) → sub-agents с tools. Model override bug требует pool-based routing.

Научное обоснование

Не маркетинг. Конкретные цифры из peer-reviewed работ.

Self-Consistency

Несколько reasoning paths + majority voting. +17.9% GSM8K, +11.0% SVAMP vs single-path. ParallelClaw: /pc-ask prompt --models 5.

Tree-of-Thought

Параллельное исследование путей лучше single-chain для сложных задач. /pc-do task --branches 3 --depth 2.

LLMxMapReduce

Naive chunking → aggregator noise. Хороший MapReduce требует structured outputs (evidence + confidence) + intelligent reduce.

Stanford Self-Play

7B бьёт 671B через 3-agent specialization. Доказательство: parallel specialization beats monolithic scale.

Debate vs Voting (arxiv 2508.17536): Majority voting объясняет почти весь прирост quality. Debate в 3× дороже и не сильно лучше. Fan-out + voting = default. Debate только для adversarial use cases.

Архитектура и ограничения

Честно: что работает, что нет, и почему это не убивает продукт.

Ограничение	Workaround	Коммуникация
Model override bug	Pool-based round-robin	«Любая доступная из конфига»
Thread binding unavailable	Fire-and-forget subagents	«Background workers»
Sub-agent overhead 15-18s	HTTP direct для простых задач	«Parallel для 3+ subtasks»
Sequential внутри сессии	Multiple sessions	«Несколько сессий для true parallel»

Слой 1: Skills

Markdown инструкции + slash-команды. Zero infrastructure, open source. /pc-ask, /pc-scan, /pc-do.

Слой 2: MCP-server

Key vault, cost ledger, connection pool (AIMD), кэш запросов. Observability и cost control.

Слой 3: Adaptive Routing

Thompson sampling bandit. Персональный benchmark. Warm-start из агрегированных priors всех пользователей.

Установка Talk While Work ✅ Ready

Готовый skill, упакован в .skill файл. Работает через AGENTS.md.

Установка

Установить skill talk-while-work — install.py добавляет routing section в AGENTS.md.

Zero config — routing сразу

System prompt получает 70+ примеров: когда direct, когда spawn. Работает immediately.

Config check для parallelism

True parallelism требует: RPM лимиты моделей, maxChildrenPerAgent в gateway config.

3 tier: Hobby / Pro / Power

Hobby: 1 модель, sequential fallback. Pro: multi-model pool. Power: adaptive routing + bandit.

Ключевое отличие от остальных паттернов: Talk While Work — это pattern внутри самого агента (self-delegation). Multi-Mind/Shard/Agent — patterns для внешнего orchestration. Разные уровни, не иерархия.

Клиентский путь: 7 актов

От лендинга до ежедневного использования.

Лендинг

GIF: /pc-ask → 4 мнения + голосование. Copy install command.

Установка

claude plugin install parallelclaw — 10-15s. Wizard: авто-детект API ключей.

Первый wow: /pc-ask

4 модели, голосование, синтез. $0.018, 5.2s. Mass intelligence — невозможно в Cursor или ChatGPT.

Второй wow: /pc-scan

87 страниц PDF за 8.2s. Batch processing revolution.

Ежедневное

/pc-ask для важных решений, /pc-scan для batch, /pc-do для deep research.

/pc-stats

Сохранённое время, win-rate, cost breakdown. Видимая ценность.

Adaptive Routing

После 100 вызовов — предложение включить bandit. «Для Go-кода вы выбираете Sonnet в 73%».

MVP: 4 недели

Честный scope. Каждая неделя — deliverable для пользователя.

Нед 1

Foundation: примитивы + инфра

Provider detection + wizard + keychain vault. pc.consensus, pc.shard, pc.compose. Skills /pc-ask, /pc-scan, /pc-do. SQLite cost ledger. Лендинг с GIF.

Нед 2

Business Templates: Due Diligence Light

/pc-dd "Company" — 7 веток, все 3 оркестрационных паттерна. /pc-compete, /pc-research. YAML definitions. Benchmark verification.

Нед 3

Polish: ошибки, retry, community

Retry с exponential backoff + graceful degradation. CONTRIBUTING.md + architecture.md. GitHub labels. Demo video 30 сек. ClawHub publication.

Нед 4

Launch: первые пользователи

HN / Reddit / Habr launch. Outreach к adjacent tool authors. 5 design partners. Install-to-first-value < 10 min. /pc-stats MVP.

Бизнес-модель + Go/No-Go

Честная монетизация и жёсткое решение через 4 недели.

Монетизация: 3 ступени

Stage 1: OSS Wedge — plugin + core lib. Бесплатно. Brand, trust, adoption.

Stage 2: ParallelClaw Cloud — hosted orchestrator, BYOK. $10-50/мес/команда.

Stage 3: Personal Agent Layer — Local Memory + Foreman + ParallelClaw. Продукт, не токены.

Что НЕ делаем

Комиссию поверх OpenRouter (маржа крошечная, BYOK обходит). Не строим свой gateway — OpenRouter уже сделал тяжёлую часть. Мы — оркестратор поверх.

Продолжаем если ✅

>2× speedup на /pc-scan
>90% reliability (0 silent failures / 50 runs)
20-30% perceived quality improvement
2 design partners за 4 недели
Install-to-first-value < 10 min

Закрываем если ❌

Нет стабильного 2× speedup
Нет 2 design partners
OpenClaw core выпускает native parallel
Model override bug не workaround'ается

Ссылки и ресурсы

parallelclaw.ai GitHub Skill: talk-while-work Self-Consistency (Wang et al.) Stanford Self-Play Debate vs Voting

ParallelClaw MVP v3 · 4 недели до первых пользователей · parallelclaw.ai