autoresearch-skill-Andrej-Karpathy
Muminur/autoresearch-skill-Andrej-KarpathyClaude Code скилл для автономной оптимизации: /autoresearch <цель> строит бенчмарк-харнесс на реальных данных, фиксирует baseline и итерирует с защитой от регрессий до достижения целевой метрики. Вдохновлён autoresearch Андрея Карпатого.
Установка
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.gitREADME
🔬 Autoresearch Skill
Автономная, целенаправленная итерация для Claude Code
Вдохновлено autoresearch Андрея Карпатого — расширено до универсального рабочего процесса на основе бенчмарков с реальными данными для любой инженерной задачи.
╔════════════════════════════════════════════════════╗
║ MODIFY → VERIFY → REGRESS → KEEP / DISCARD → ∞ ║
╚════════════════════════════════════════════════════╝
✨ Что это такое?
Autoresearch — это Claude Code скилл, который превращает произвольно сформулированную цель вида
/autoresearch reduce API p95 latency to 200ms
в автономный, самокорректирующийся цикл оптимизации, который:
- 🧠 Разбирает цель на семь машиночитаемых слотов
- 📦 Загружает реальные данные (отказывается от синтетических корпусов)
- 🛠️ Строит однофайловый бенчмарк-харнесс
- 📐 Фиксирует baseline + количество регрессионных тестов
- 🔁 Итерирует — по одному атомарному изменению за раз
- ✅ Сохраняет улучшения, 🗑️ автоматически откатывает регрессии, логирует всё
- 🏁 Останавливается, когда целевая метрика достигнута
Без подсказок. Без «продолжать?». Только механическая итерация до достижения цели.
🌟 Зачем использовать?
🎯 Механически, не субъективно
Каждая итерация оценивается единственной числовой метрикой, извлечённой из команды. «Выглядит лучше» — запрещено.
🛡️ Защита от регрессий
Жёсткий шлюз откатывает любое изменение, которое ломает ранее проходившие тесты — независимо от величины улучшения.
📊 Только реальные данные
Харнесс отказывается от синтетических корпусов. Если данные нельзя собрать, экспортировать или получить из реальной системы — цикл не запустится.
♻️ Атомарно и обратимо
Одно изменение за итерацию, зафиксированное в git до верификации. Неудачный эксперимент всегда отменяется через git reset --hard HEAD~1.
🧩 Не зависит от домена
Задержка бэкенда, покрытие тестами, размер бандла, нестабильность тестов, LOC, время сборки, lighthouse-оценки — один и тот же цикл, разные метрики.
🌐 Глобальный Claude Code скилл
Установите один раз в ~/.claude/skills/autoresearch/ и вызывайте /autoresearch <цель> из любого проекта.
🚀 Быстрый старт
1. Установка (глобальный скилл)
# Клонируйте в директорию скиллов Claude Code
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.git \
~/.claude/skills/autoresearchДля Windows:
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.git `
"$env:USERPROFILE\.claude\skills\autoresearch"2. Вызов
Откройте Claude Code в любом проекте и введите:
/autoresearch reduce avg_latency_ms below 500
Claude выведет дамп разобранных слотов, пройдёт пять фаз построения харнесса, затем запустит автономный цикл.
3. Наблюдайте за работой
Результаты добавляются в autoresearch/results.tsv в вашем проекте:
commit metric avg_latency_ms status description
953b71d 1.000000 2008.9 baseline 77-case corpus, 10 signals executed
953b71d 1.000000 646.4 keep parallelize _place_exits with asyncio.gather
953b71d 1.000000 592.1 keep add 30s TTL cache on account()
953b71d 1.000000 488.8 keep prewarm account+connection pool, serialize signals🔌 Использование с другими AI-ассистентами для кода
Скилл представляет собой обычный Markdown — добавьте его в любой агент, поддерживающий пользовательские промпты, правила или инструкции. Клонируйте репозиторий один раз во временную директорию, затем создайте симлинк или скопируйте файлы в путь конфигурации нужного инструмента:
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.git ~/autoresearch-skillДля Windows замените ~/autoresearch-skill на %USERPROFILE%\autoresearch-skill в командах ниже.
🧠 OpenAI Codex CLI
Codex CLI загружает пользовательские промпты из ~/.codex/prompts/.
mkdir -p ~/.codex/prompts
cp ~/autoresearch-skill/SKILL.md ~/.codex/prompts/autoresearch.md
cp -r ~/autoresearch-skill/references ~/.codex/prompts/Вызов в чате Codex: /autoresearch reduce API p95 to 200ms.
💡 Совет — добавьте
@file ~/.codex/prompts/autoresearch.mdв~/.codex/AGENTS.md, чтобы рубрика загружалась автоматически в каждой сессии.
🤖 GitHub Copilot (VS Code и JetBrains)
Copilot Chat поддерживает файлы промптов (*.prompt.md) и файлы инструкций (*.instructions.md).
Уровень проекта (добавляется в репозиторий):
mkdir -p .github/prompts
cp ~/autoresearch-skill/SKILL.md .github/prompts/autoresearch.prompt.md
cp -r ~/autoresearch-skill/references .github/prompts/Уровень пользователя (доступно во всех проектах):
| ОС | Путь |
|---|---|
| Windows | %APPDATA%\Code\User\prompts\autoresearch.prompt.md |
| macOS | ~/Library/Application Support/Code/User/prompts/autoresearch.prompt.md |
| Linux | ~/.config/Code/User/prompts/autoresearch.prompt.md |
Включите файлы промптов в settings.json VS Code:
{ "chat.promptFiles": true }
Вызов: /autoresearch <цель> в Copilot Chat.
🪐 OpenCode
OpenCode хранит пользовательские команды в ~/.config/opencode/command/.
mkdir -p ~/.config/opencode/command
cp ~/autoresearch-skill/SKILL.md ~/.config/opencode/command/autoresearch.md
cp -r ~/autoresearch-skill/references ~/.config/opencode/command/Вызов: /autoresearch <цель> в OpenCode.
⚡ Cursor
Cursor загружает правила проекта из .cursor/rules/ и глобальные правила пользователя из ~/.cursor/rules/.
# Уровень проекта
mkdir -p .cursor/rules
cp ~/autoresearch-skill/SKILL.md .cursor/rules/autoresearch.mdc
cp -r ~/autoresearch-skill/references .cursor/rules/
# Уровень пользователя (глобально)
mkdir -p ~/.cursor/rules
cp ~/autoresearch-skill/SKILL.md ~/.cursor/rules/autoresearch.mdc
cp -r ~/autoresearch-skill/references ~/.cursor/rules/Вызов: упомяните /autoresearch <цель> в чате Cursor или добавьте его в системный промпт.
📁 Структура репозитория
autoresearch-skill-Andrej-Karpathy/
├── SKILL.md # Основной файл скилла (промпт агента)
├── references/ # Вспомогательные справочные материалы
├── CHANGELOG.md # История версий
├── LICENSE # MIT лицензия
└── README.md # Этот файл
🤝 Участие в разработке
Pull request'ы приветствуются. Для крупных изменений сначала откройте issue для обсуждения.
📄 Лицензия
MIT — подробности в файле LICENSE.
Вдохновлено autoresearch Андрея Карпатого