opus-mind
Hybirdss/opus-mindИнструмент для аудита CLAUDE.md-промптов по 11 инвариантам, извлечённым из утёкшего системного промпта Opus 4.7. LINT проверяет системные промпты, BOOST улучшает пользовательские. Без API-ключей, на regex и счётчиках.
Установка
git clone https://github.com/Hybirdss/opus-mind.gitREADME
opus-mind
Линтер для системных промптов в стиле CLAUDE.md, построенный на основе 1408-строчного
системного промпта Opus 4.7, утёкшего через CL4R1T4S.
Поставляется как Claude Code skill и CLI. Каждое правило привязано к конкретной
строке источника. Никаких LLM-вызовов в scorer — только regex и счётчики.
$ opus-mind lint audit production/system-prompt.md
score: 9/11 verdict: BORDERLINE
invariants:
[PASS] I1_reduce_interpretation (unmeasured: no fail bucket in corpus)
[FAIL] I6_failure_modes_explicit (load-bearing: Δ=+0.50 on blind-eval)
[PASS] I8_default_exception (anti-signal: Δ=-0.19 on blind-eval)
...
Каждый инвариант показывает свой измеренный эффект из evals/REPORT.md — насколько выше, ниже или одинаково слепые LLM-оценщики оценивали промпты, прошедшие эту проверку, по сравнению с теми, что её не прошли. Никаких неизмеренных утверждений: неизмеренные инварианты помечены соответствующим образом.
Внутри того же skill есть второй инструмент для другой части работы с промптами — одиночных запросов, которые вы отправляете в Claude / ChatGPT / Cursor каждый день.
$ opus-mind boost check "write a blog post about AI safety"
coverage: 1/10 task_type: write
empty, ranked by impact:
[ ] B4 context for 'write' tasks, audience dominates
[ ] B6 constraints tone / avoid-list
[ ] B3 length 300 words / 5 bullets / under 200 tokens
...
한국어: README.ko.md
LINT — system prompts BOOST — user prompts
───────────────────── ─────────────────────
CLAUDE.md / AGENTS.md prompts you send to an LLM
.cursorrules / SKILL.md "write me a blog post..."
11 structural invariants 10 slots (7 spec + 3 reasoning)
audits agent-design quality audits specification quality
gates the commit coaches the prompter
Для чего это нужно
Репозиторий ориентирован на безопасность AI-продуктов, которые вы выпускаете, а не на повышение интеллекта LLM. Цель — не допустить, чтобы потребительский AI выдавал неожиданные результаты, превращающиеся в инциденты: отказ, который проскальзывает, инструкция, которая утекает, правило, которое размывается после нескольких вежливых повторных запросов.
Исходный промпт Opus 4.7, который реверс-инжинирует этот репозиторий, написан с тем же приоритетом. Те 1408 строк — в основном несущие ограждения, а не настройка возможностей. opus-mind наследует этот подход: LINT укрепляет производственный системный промпт против тех режимов отказа, против которых писал Anthropic.
(Если вы хотите настраивать возможности — chain-of-thought, использование инструментов, формат вывода — для этого предназначена часть BOOST, на стороне пользовательских промптов. Это другая задача.)
Почему я это написал
Мой CLAUDE.md деградировал. Я начал с чётких правил, продолжал вставлять
строки, предложенные моделью, и через несколько месяцев заметил, что never X превратилось
в typically avoid X. Никакого ревьюера, чтобы это поймать, никакой объективной планки
для измерения.
Утёкший промпт Opus 4.7 оказался именно такой планкой. 1408 строк правил, которые Anthropic поставляет своей флагманской модели. Каждый паттерн, который вы хотели бы видеть в производственном промпте, там есть, уже откалиброванный: конкретные числа вместо прилагательных, деревья решений вместо неупорядоченных списков, reframe-as-signal для обнаружения дрейфа при джейлбрейке. Я извлёк паттерны, написал regex для их обнаружения (и их отсутствия) и упаковал результат в линтер.
BOOST появился позже. Та же идея движка, другая цель — вместо оценки системного промпта, который я не писал, он помогает улучшить чат-промпт, который я пишу, указывая на 10 слотов, отделяющих хороший промпт от расплывчатого.
Установка
Внутри Claude Code (рекомендуется):
git clone https://github.com/Hybirdss/opus-mind
cd opus-mind
bash skills/opus-mind/scripts/install-skill.shЗатем перезапустите Claude Code и общайтесь с ним как обычно — «проверь мой CLAUDE.md», «мой бот продолжает уступать после отказов», «помоги улучшить этот промпт». Claude читает skill, запускает вспомогательные инструменты под капотом и формирует ответ. API-ключ не нужен — вы уже разговариваете с Claude.
Автономно (pre-commit hook, CI, скрипты):
opus_mind=skills/opus-mind/scripts/opus-mind
$opus_mind lint audit path/to/CLAUDE.md # оценка + результаты
$opus_mind lint critic path/to/CLAUDE.md # цикл аудит → исправление → повторный аудит
$opus_mind lint seed --type customer-bot # скелет с оценкой 9+/11 из коробки
$opus_mind boost check "your prompt here"
$opus_mind boost ask "your prompt here" # по одному вопросу за раз
$opus_mind boost expand "your prompt" --length "300 words" --format markdownБлокировка коммитов по порогу:
bash skills/opus-mind/scripts/install-hook.sh --threshold 6
Что проверяется
LINT — 11 инвариантов. Каждый сигнал привязан к конкретной строке источника Opus 4.7.
| ID | Что проверяется | Источник Opus 4.7 |
|---|---|---|
| I1 | плотность хеджирования ≤ 0.25, плотность чисел ≥ 0.10 | L664, L620 |
| I2 | лестницы Step N → ... для маршрутизации | L515–L537 |
| I3 | reframe-as-signal при наличии контента с отказом | L33 |
| I4 | ноль нарративных преамбул | L536, L560 |
| I5 | примеры содержат обоснование | L710–L750 |
| I6 | утверждения о последствиях масштабируются с директивами | L753–L759 |
| I7 | блоки {foo}…{/foo} сбалансированы | структурный |
| I8 | default и exception встречаются совместно | L25, L57–68 |
| I9 | блок самопроверки для длинных промптов | L698–L707 |
| I10 | метки уровней ЗАГЛАВНЫМИ БУКВАМИ для контента с высокими ставками | L640, L657 |
| I11 | иерархическое переопределение / цепочка Tier | L657 |
Два дополнения помимо pass/fail: перечисление verdict (THIN / POOR /
BORDERLINE / GOOD) и счётчик заглушек — остатки <FIXME>, [TODO],
TBD, ???, XXX блокируют вердикт GOOD, даже если 11
структурных проверок пройдены.
BOOST — 10 слотов. Уровень спецификации (B1–B7) основан на публичной документации Anthropic по промптингу. Уровень рассуждений (B8–B10) основан на доказательной базе по улучшению качества вывода.