Claude Info
AI и агенты

autoresearch-skill-Andrej-Karpathy

Muminur/autoresearch-skill-Andrej-Karpathy

Claude Code скилл для автономной оптимизации: /autoresearch <цель> строит бенчмарк-харнесс на реальных данных, фиксирует baseline и итерирует с защитой от регрессий до достижения целевой метрики. Вдохновлён autoresearch Андрея Карпатого.

Установка

terminal
bash
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.git

README

🔬 Autoresearch Skill

Автономная, целенаправленная итерация для Claude Code

Вдохновлено autoresearch Андрея Карпатого — расширено до универсального рабочего процесса на основе бенчмарков с реальными данными для любой инженерной задачи.

Version Claude Code License Karpathy Status

╔════════════════════════════════════════════════════╗ ║ MODIFY → VERIFY → REGRESS → KEEP / DISCARD → ∞ ║ ╚════════════════════════════════════════════════════╝

✨ Что это такое?

Autoresearch — это Claude Code скилл, который превращает произвольно сформулированную цель вида

/autoresearch reduce API p95 latency to 200ms

в автономный, самокорректирующийся цикл оптимизации, который:

  1. 🧠 Разбирает цель на семь машиночитаемых слотов
  2. 📦 Загружает реальные данные (отказывается от синтетических корпусов)
  3. 🛠️ Строит однофайловый бенчмарк-харнесс
  4. 📐 Фиксирует baseline + количество регрессионных тестов
  5. 🔁 Итерирует — по одному атомарному изменению за раз
  6. Сохраняет улучшения, 🗑️ автоматически откатывает регрессии, логирует всё
  7. 🏁 Останавливается, когда целевая метрика достигнута

Без подсказок. Без «продолжать?». Только механическая итерация до достижения цели.


🌟 Зачем использовать?

🎯 Механически, не субъективно

Каждая итерация оценивается единственной числовой метрикой, извлечённой из команды. «Выглядит лучше» — запрещено.

🛡️ Защита от регрессий

Жёсткий шлюз откатывает любое изменение, которое ломает ранее проходившие тесты — независимо от величины улучшения.

📊 Только реальные данные

Харнесс отказывается от синтетических корпусов. Если данные нельзя собрать, экспортировать или получить из реальной системы — цикл не запустится.

♻️ Атомарно и обратимо

Одно изменение за итерацию, зафиксированное в git до верификации. Неудачный эксперимент всегда отменяется через git reset --hard HEAD~1.

🧩 Не зависит от домена

Задержка бэкенда, покрытие тестами, размер бандла, нестабильность тестов, LOC, время сборки, lighthouse-оценки — один и тот же цикл, разные метрики.

🌐 Глобальный Claude Code скилл

Установите один раз в ~/.claude/skills/autoresearch/ и вызывайте /autoresearch <цель> из любого проекта.


🚀 Быстрый старт

1. Установка (глобальный скилл)

bash
# Клонируйте в директорию скиллов Claude Code
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.git \
  ~/.claude/skills/autoresearch

Для Windows:

powershell
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.git `
  "$env:USERPROFILE\.claude\skills\autoresearch"

2. Вызов

Откройте Claude Code в любом проекте и введите:

/autoresearch reduce avg_latency_ms below 500

Claude выведет дамп разобранных слотов, пройдёт пять фаз построения харнесса, затем запустит автономный цикл.

3. Наблюдайте за работой

Результаты добавляются в autoresearch/results.tsv в вашем проекте:

tsv
commit    metric     avg_latency_ms  status      description
953b71d   1.000000   2008.9          baseline    77-case corpus, 10 signals executed
953b71d   1.000000   646.4           keep        parallelize _place_exits with asyncio.gather
953b71d   1.000000   592.1           keep        add 30s TTL cache on account()
953b71d   1.000000   488.8           keep        prewarm account+connection pool, serialize signals

🔌 Использование с другими AI-ассистентами для кода

Скилл представляет собой обычный Markdown — добавьте его в любой агент, поддерживающий пользовательские промпты, правила или инструкции. Клонируйте репозиторий один раз во временную директорию, затем создайте симлинк или скопируйте файлы в путь конфигурации нужного инструмента:

bash
git clone https://github.com/Muminur/autoresearch-skill-Andrej-Karpathy.git ~/autoresearch-skill

Для Windows замените ~/autoresearch-skill на %USERPROFILE%\autoresearch-skill в командах ниже.

🧠 OpenAI Codex CLI

Codex CLI загружает пользовательские промпты из ~/.codex/prompts/.

bash
mkdir -p ~/.codex/prompts
cp    ~/autoresearch-skill/SKILL.md  ~/.codex/prompts/autoresearch.md
cp -r ~/autoresearch-skill/references ~/.codex/prompts/

Вызов в чате Codex: /autoresearch reduce API p95 to 200ms.

💡 Совет — добавьте @file ~/.codex/prompts/autoresearch.md в ~/.codex/AGENTS.md, чтобы рубрика загружалась автоматически в каждой сессии.

🤖 GitHub Copilot (VS Code и JetBrains)

Copilot Chat поддерживает файлы промптов (*.prompt.md) и файлы инструкций (*.instructions.md).

Уровень проекта (добавляется в репозиторий):

bash
mkdir -p .github/prompts
cp    ~/autoresearch-skill/SKILL.md  .github/prompts/autoresearch.prompt.md
cp -r ~/autoresearch-skill/references .github/prompts/

Уровень пользователя (доступно во всех проектах):

ОСПуть
Windows%APPDATA%\Code\User\prompts\autoresearch.prompt.md
macOS~/Library/Application Support/Code/User/prompts/autoresearch.prompt.md
Linux~/.config/Code/User/prompts/autoresearch.prompt.md

Включите файлы промптов в settings.json VS Code:

{ "chat.promptFiles": true }

Вызов: /autoresearch <цель> в Copilot Chat.

🪐 OpenCode

OpenCode хранит пользовательские команды в ~/.config/opencode/command/.

bash
mkdir -p ~/.config/opencode/command
cp    ~/autoresearch-skill/SKILL.md  ~/.config/opencode/command/autoresearch.md
cp -r ~/autoresearch-skill/references ~/.config/opencode/command/

Вызов: /autoresearch <цель> в OpenCode.

⚡ Cursor

Cursor загружает правила проекта из .cursor/rules/ и глобальные правила пользователя из ~/.cursor/rules/.

bash
# Уровень проекта
mkdir -p .cursor/rules
cp    ~/autoresearch-skill/SKILL.md  .cursor/rules/autoresearch.mdc
cp -r ~/autoresearch-skill/references .cursor/rules/

# Уровень пользователя (глобально)
mkdir -p ~/.cursor/rules
cp    ~/autoresearch-skill/SKILL.md  ~/.cursor/rules/autoresearch.mdc
cp -r ~/autoresearch-skill/references ~/.cursor/rules/

Вызов: упомяните /autoresearch <цель> в чате Cursor или добавьте его в системный промпт.


📁 Структура репозитория

autoresearch-skill-Andrej-Karpathy/ ├── SKILL.md # Основной файл скилла (промпт агента) ├── references/ # Вспомогательные справочные материалы ├── CHANGELOG.md # История версий ├── LICENSE # MIT лицензия └── README.md # Этот файл

🤝 Участие в разработке

Pull request'ы приветствуются. Для крупных изменений сначала откройте issue для обсуждения.


📄 Лицензия

MIT — подробности в файле LICENSE.


Вдохновлено autoresearch Андрея Карпатого

Похожие скиллы