opus-mind

Линтер для системных промптов в стиле CLAUDE.md, построенный на основе 1408-строчного системного промпта Opus 4.7, утёкшего через CL4R1T4S. Поставляется как Claude Code skill и CLI. Каждое правило привязано к конкретной строке источника. Никаких LLM-вызовов в scorer — только regex и счётчики.

$ opus-mind lint audit production/system-prompt.md
score: 9/11   verdict: BORDERLINE

invariants:
  [PASS] I1_reduce_interpretation  (unmeasured: no fail bucket in corpus)
  [FAIL] I6_failure_modes_explicit (load-bearing: Δ=+0.50 on blind-eval)
  [PASS] I8_default_exception      (anti-signal: Δ=-0.19 on blind-eval)
  ...

Каждый инвариант показывает свой измеренный эффект из evals/REPORT.md — насколько выше, ниже или одинаково слепые LLM-оценщики оценивали промпты, прошедшие эту проверку, по сравнению с теми, что её не прошли. Никаких неизмеренных утверждений: неизмеренные инварианты помечены соответствующим образом.

Внутри того же skill есть второй инструмент для другой части работы с промптами — одиночных запросов, которые вы отправляете в Claude / ChatGPT / Cursor каждый день.

$ opus-mind boost check "write a blog post about AI safety"
coverage: 1/10    task_type: write

empty, ranked by impact:
  [ ] B4 context        for 'write' tasks, audience dominates
  [ ] B6 constraints    tone / avoid-list
  [ ] B3 length         300 words / 5 bullets / under 200 tokens
  ...

한국어: README.ko.md

    LINT — system prompts                     BOOST — user prompts
    ─────────────────────                      ─────────────────────
    CLAUDE.md / AGENTS.md                     prompts you send to an LLM
    .cursorrules / SKILL.md                   "write me a blog post..."

    11 structural invariants                  10 slots (7 spec + 3 reasoning)
    audits agent-design quality               audits specification quality
    gates the commit                          coaches the prompter

Для чего это нужно

Репозиторий ориентирован на безопасность AI-продуктов, которые вы выпускаете, а не на повышение интеллекта LLM. Цель — не допустить, чтобы потребительский AI выдавал неожиданные результаты, превращающиеся в инциденты: отказ, который проскальзывает, инструкция, которая утекает, правило, которое размывается после нескольких вежливых повторных запросов.

Исходный промпт Opus 4.7, который реверс-инжинирует этот репозиторий, написан с тем же приоритетом. Те 1408 строк — в основном несущие ограждения, а не настройка возможностей. opus-mind наследует этот подход: LINT укрепляет производственный системный промпт против тех режимов отказа, против которых писал Anthropic.

(Если вы хотите настраивать возможности — chain-of-thought, использование инструментов, формат вывода — для этого предназначена часть BOOST, на стороне пользовательских промптов. Это другая задача.)

Почему я это написал

Мой CLAUDE.md деградировал. Я начал с чётких правил, продолжал вставлять строки, предложенные моделью, и через несколько месяцев заметил, что never X превратилось в typically avoid X. Никакого ревьюера, чтобы это поймать, никакой объективной планки для измерения.

Утёкший промпт Opus 4.7 оказался именно такой планкой. 1408 строк правил, которые Anthropic поставляет своей флагманской модели. Каждый паттерн, который вы хотели бы видеть в производственном промпте, там есть, уже откалиброванный: конкретные числа вместо прилагательных, деревья решений вместо неупорядоченных списков, reframe-as-signal для обнаружения дрейфа при джейлбрейке. Я извлёк паттерны, написал regex для их обнаружения (и их отсутствия) и упаковал результат в линтер.

BOOST появился позже. Та же идея движка, другая цель — вместо оценки системного промпта, который я не писал, он помогает улучшить чат-промпт, который я пишу, указывая на 10 слотов, отделяющих хороший промпт от расплывчатого.

Установка

Внутри Claude Code (рекомендуется):

bash

git clone https://github.com/Hybirdss/opus-mind
cd opus-mind
bash skills/opus-mind/scripts/install-skill.sh

Затем перезапустите Claude Code и общайтесь с ним как обычно — «проверь мой CLAUDE.md», «мой бот продолжает уступать после отказов», «помоги улучшить этот промпт». Claude читает skill, запускает вспомогательные инструменты под капотом и формирует ответ. API-ключ не нужен — вы уже разговариваете с Claude.

Автономно (pre-commit hook, CI, скрипты):

bash

opus_mind=skills/opus-mind/scripts/opus-mind

$opus_mind lint audit path/to/CLAUDE.md        # оценка + результаты
$opus_mind lint critic path/to/CLAUDE.md       # цикл аудит → исправление → повторный аудит
$opus_mind lint seed --type customer-bot       # скелет с оценкой 9+/11 из коробки

$opus_mind boost check "your prompt here"
$opus_mind boost ask   "your prompt here"      # по одному вопросу за раз
$opus_mind boost expand "your prompt" --length "300 words" --format markdown

Блокировка коммитов по порогу:

bash skills/opus-mind/scripts/install-hook.sh --threshold 6

Что проверяется

LINT — 11 инвариантов. Каждый сигнал привязан к конкретной строке источника Opus 4.7.

ID	Что проверяется	Источник Opus 4.7
I1	плотность хеджирования ≤ 0.25, плотность чисел ≥ 0.10	L664, L620
I2	лестницы `Step N → ...` для маршрутизации	L515–L537
I3	reframe-as-signal при наличии контента с отказом	L33
I4	ноль нарративных преамбул	L536, L560
I5	примеры содержат обоснование	L710–L750
I6	утверждения о последствиях масштабируются с директивами	L753–L759
I7	блоки `{foo}…{/foo}` сбалансированы	структурный
I8	default и exception встречаются совместно	L25, L57–68
I9	блок самопроверки для длинных промптов	L698–L707
I10	метки уровней ЗАГЛАВНЫМИ БУКВАМИ для контента с высокими ставками	L640, L657
I11	иерархическое переопределение / цепочка Tier	L657

Два дополнения помимо pass/fail: перечисление verdict (THIN / POOR / BORDERLINE / GOOD) и счётчик заглушек — остатки <FIXME>, [TODO], TBD, ???, XXX блокируют вердикт GOOD, даже если 11 структурных проверок пройдены.

BOOST — 10 слотов. Уровень спецификации (B1–B7) основан на публичной документации Anthropic по промптингу. Уровень рассуждений (B8–B10) основан на доказательной базе по улучшению качества вывода.

opus-mind

Установка

README

opus-mind

Для чего это нужно

Почему я это написал

Установка

Что проверяется

Похожие скиллы

claude-mem

oh-my-openagent

Агенты и оркестрация

NanoClaw