Claude Info
AI и агенты

opus-mind

Hybirdss/opus-mind

Инструмент для аудита CLAUDE.md-промптов по 11 инвариантам, извлечённым из утёкшего системного промпта Opus 4.7. LINT проверяет системные промпты, BOOST улучшает пользовательские. Без API-ключей, на regex и счётчиках.

Установка

terminal
bash
git clone https://github.com/Hybirdss/opus-mind.git

README

opus-mind

Линтер для системных промптов в стиле CLAUDE.md, построенный на основе 1408-строчного системного промпта Opus 4.7, утёкшего через CL4R1T4S. Поставляется как Claude Code skill и CLI. Каждое правило привязано к конкретной строке источника. Никаких LLM-вызовов в scorer — только regex и счётчики.

$ opus-mind lint audit production/system-prompt.md score: 9/11 verdict: BORDERLINE invariants: [PASS] I1_reduce_interpretation (unmeasured: no fail bucket in corpus) [FAIL] I6_failure_modes_explicit (load-bearing: Δ=+0.50 on blind-eval) [PASS] I8_default_exception (anti-signal: Δ=-0.19 on blind-eval) ...

Каждый инвариант показывает свой измеренный эффект из evals/REPORT.md — насколько выше, ниже или одинаково слепые LLM-оценщики оценивали промпты, прошедшие эту проверку, по сравнению с теми, что её не прошли. Никаких неизмеренных утверждений: неизмеренные инварианты помечены соответствующим образом.

Внутри того же skill есть второй инструмент для другой части работы с промптами — одиночных запросов, которые вы отправляете в Claude / ChatGPT / Cursor каждый день.

$ opus-mind boost check "write a blog post about AI safety" coverage: 1/10 task_type: write empty, ranked by impact: [ ] B4 context for 'write' tasks, audience dominates [ ] B6 constraints tone / avoid-list [ ] B3 length 300 words / 5 bullets / under 200 tokens ...

한국어: README.ko.md

LINT — system prompts BOOST — user prompts ───────────────────── ───────────────────── CLAUDE.md / AGENTS.md prompts you send to an LLM .cursorrules / SKILL.md "write me a blog post..." 11 structural invariants 10 slots (7 spec + 3 reasoning) audits agent-design quality audits specification quality gates the commit coaches the prompter

Для чего это нужно

Репозиторий ориентирован на безопасность AI-продуктов, которые вы выпускаете, а не на повышение интеллекта LLM. Цель — не допустить, чтобы потребительский AI выдавал неожиданные результаты, превращающиеся в инциденты: отказ, который проскальзывает, инструкция, которая утекает, правило, которое размывается после нескольких вежливых повторных запросов.

Исходный промпт Opus 4.7, который реверс-инжинирует этот репозиторий, написан с тем же приоритетом. Те 1408 строк — в основном несущие ограждения, а не настройка возможностей. opus-mind наследует этот подход: LINT укрепляет производственный системный промпт против тех режимов отказа, против которых писал Anthropic.

(Если вы хотите настраивать возможности — chain-of-thought, использование инструментов, формат вывода — для этого предназначена часть BOOST, на стороне пользовательских промптов. Это другая задача.)


Почему я это написал

Мой CLAUDE.md деградировал. Я начал с чётких правил, продолжал вставлять строки, предложенные моделью, и через несколько месяцев заметил, что never X превратилось в typically avoid X. Никакого ревьюера, чтобы это поймать, никакой объективной планки для измерения.

Утёкший промпт Opus 4.7 оказался именно такой планкой. 1408 строк правил, которые Anthropic поставляет своей флагманской модели. Каждый паттерн, который вы хотели бы видеть в производственном промпте, там есть, уже откалиброванный: конкретные числа вместо прилагательных, деревья решений вместо неупорядоченных списков, reframe-as-signal для обнаружения дрейфа при джейлбрейке. Я извлёк паттерны, написал regex для их обнаружения (и их отсутствия) и упаковал результат в линтер.

BOOST появился позже. Та же идея движка, другая цель — вместо оценки системного промпта, который я не писал, он помогает улучшить чат-промпт, который я пишу, указывая на 10 слотов, отделяющих хороший промпт от расплывчатого.


Установка

Внутри Claude Code (рекомендуется):

bash
git clone https://github.com/Hybirdss/opus-mind
cd opus-mind
bash skills/opus-mind/scripts/install-skill.sh

Затем перезапустите Claude Code и общайтесь с ним как обычно — «проверь мой CLAUDE.md», «мой бот продолжает уступать после отказов», «помоги улучшить этот промпт». Claude читает skill, запускает вспомогательные инструменты под капотом и формирует ответ. API-ключ не нужен — вы уже разговариваете с Claude.

Автономно (pre-commit hook, CI, скрипты):

bash
opus_mind=skills/opus-mind/scripts/opus-mind

$opus_mind lint audit path/to/CLAUDE.md        # оценка + результаты
$opus_mind lint critic path/to/CLAUDE.md       # цикл аудит → исправление → повторный аудит
$opus_mind lint seed --type customer-bot       # скелет с оценкой 9+/11 из коробки

$opus_mind boost check "your prompt here"
$opus_mind boost ask   "your prompt here"      # по одному вопросу за раз
$opus_mind boost expand "your prompt" --length "300 words" --format markdown

Блокировка коммитов по порогу:

bash skills/opus-mind/scripts/install-hook.sh --threshold 6

Что проверяется

LINT — 11 инвариантов. Каждый сигнал привязан к конкретной строке источника Opus 4.7.

IDЧто проверяетсяИсточник Opus 4.7
I1плотность хеджирования ≤ 0.25, плотность чисел ≥ 0.10L664, L620
I2лестницы Step N → ... для маршрутизацииL515–L537
I3reframe-as-signal при наличии контента с отказомL33
I4ноль нарративных преамбулL536, L560
I5примеры содержат обоснованиеL710–L750
I6утверждения о последствиях масштабируются с директивамиL753–L759
I7блоки {foo}…{/foo} сбалансированыструктурный
I8default и exception встречаются совместноL25, L57–68
I9блок самопроверки для длинных промптовL698–L707
I10метки уровней ЗАГЛАВНЫМИ БУКВАМИ для контента с высокими ставкамиL640, L657
I11иерархическое переопределение / цепочка TierL657

Два дополнения помимо pass/fail: перечисление verdict (THIN / POOR / BORDERLINE / GOOD) и счётчик заглушек — остатки <FIXME>, [TODO], TBD, ???, XXX блокируют вердикт GOOD, даже если 11 структурных проверок пройдены.

BOOST — 10 слотов. Уровень спецификации (B1–B7) основан на публичной документации Anthropic по промптингу. Уровень рассуждений (B8–B10) основан на доказательной базе по улучшению качества вывода.

Похожие скиллы