Claude Info
AI и агенты

SkillCompass

Evol-ai/SkillCompass

Инструмент для оценки и управления качеством скиллов Claude Code и OpenClaw. Шестимерная система оценки, отслеживание использования, направленное улучшение и верификация изменений. Для разработчиков, которым нужна измеримая качество агентных скиллов.

Установка

terminal
bash
npx skills add Evol-ai/SkillCompass

README


Что этоЛокальный инструмент оценки качества скиллов и управления ими для Claude Code / OpenClaw. Шестимерная система оценки, предложения на основе статистики использования, управляемое улучшение, отслеживание версий.
Какую проблему решаетПревращает подход «правлю наугад и надеюсь» в цикл: диагностика → точечное исправление → подтверждённое улучшение. Превращает «установил и забыл» в постоянную видимость того, что работает, что устарело и что несёт риски.
Запуск за 30 секунд/skillcompass — общий обзор состояния скиллов. /eval-skill {path} — мгновенный отчёт о качестве с указанием слабейшего места и следующего шага.

Оцени → найди слабое звено → исправь → докажи результат → следующая слабость → повторяй. Тем временем Skill Inbox отслеживает использование и сообщает, что требует внимания.


Для кого этот инструмент

Подходит

  • Всем, кто поддерживает агентные скиллы и хочет измеримого качества
  • Разработчикам, которым нужно направленное улучшение — не угадывание, а точное знание, какое измерение исправлять следующим
  • Командам, которым нужен quality gate — любой инструмент, редактирующий скилл, запускает автоматическую оценку
  • Пользователям, установившим много скиллов и нуждающимся в видимости того, что реально используется, что устарело и что несёт риски

Не подходит

  • Для общего code review или отладки в runtime
  • Для создания новых скиллов с нуля (используйте skill-creator)
  • Для оценки файлов, не являющихся скиллами

Быстрый старт

Требования: Claude Opus 4.6 (сложные рассуждения + стабильная оценка) · Node.js v18+ (локальные валидаторы)

Установка одной командой (рекомендуется)

npx skills add Evol-ai/SkillCompass

Поддерживает 45+ агентов, включая Claude Code, Codex, Cursor, Cline, Gemini CLI, GitHub Copilot и другие. CLI автоматически определяет установленных агентов и размещает скилл в нужном месте.

Claude Code (ручная установка)

bash
git clone https://github.com/Evol-ai/SkillCompass.git
cd SkillCompass && npm install

# На уровне пользователя (все проекты)
rsync -a --exclude='.git'  . ~/.claude/skills/skill-compass/

# Или на уровне проекта (только текущий проект)
rsync -a --exclude='.git'  . .claude/skills/skill-compass/

Первый запуск: SkillCompass автоматически запускает краткое знакомство — сканирует установленные скиллы (~5 секунд), предлагает настройку statusLine, затем возвращает управление. Claude Code запросит разрешение на выполнение команд node; выберите «Allow always», чтобы избежать повторных запросов.

OpenClaw

bash
git clone https://github.com/Evol-ai/SkillCompass.git
cd SkillCompass && npm install
# Следуйте документации OpenClaw по установке скиллов для вашей конфигурации
rsync -a --exclude='.git'  . <your-openclaw-skills-path>/skill-compass/

Если ваши скиллы OpenClaw находятся за пределами корневых директорий сканирования по умолчанию, добавьте их в skills.load.extraDirs в файле ~/.openclaw/openclaw.json:

json
{
  "skills": {
    "load": {
      "extraDirs": ["<your-openclaw-skills-path>"]
    }
  }
}

Использование

/skillcompass — единая точка входа. Используйте slash-команду или просто говорите естественным языком — оба варианта работают:

/skillcompass → обзор того, что требует внимания /skillcompass evaluate my-skill → шестимерный отчёт о качестве "improve the nano-banana skill" → исправить слабейшее измерение, верифицировать, следующее "what skills haven't I used recently?" → аналитика на основе использования "security scan this skill" → углублённый аудит безопасности D3

Что умеет инструмент

Оценка — не самоцель, важно направление. Вы мгновенно видите, какое измерение является узким местом и что с этим делать.

Каждый цикл /eval-improve следует замкнутому контуру: исправить слабейшее → переоценить → подтвердить улучшение → следующее слабейшее. Ни одно исправление не сохраняется, пока повторная оценка не подтвердит его эффективность.


Шестимерная модель оценки

IDИзмерениеВесЧто оценивается
D1Структура10%Валидность frontmatter, формат markdown, объявления
D2Триггер15%Качество активации, точность отклонения, обнаруживаемость
D3Безопасность20%Секреты, инъекции, разрешения, утечка данных, встроенные shell-команды
D4Функциональность30%Базовое качество, граничные случаи, стабильность вывода, обработка ошибок
D5Сравнительная15%Ценность по сравнению с прямым промптингом (со скиллом и без)
D6Уникальность10%Пересечение с похожими скиллами, риск вытеснения моделью
overall_score = round((D1×0.10 + D2×0.15 + D3×0.20 + D4×0.30 + D5×0.15 + D6×0.10) × 10)
ВердиктУсловие
PASSscore >= 70 И D3 pass
CAUTION50–69, или D3 High findings
FAILscore < 50, или D3 Critical (принудительный gate)

Skill Inbox — предложения на основе использования

SkillCompass пассивно отслеживает, какие скиллы вы реально используете, и выдаёт предложения, когда что-то требует внимания — неиспользуемые скиллы, устаревшие оценки, снижение активности, доступные обновления и многое другое. 9 встроенных правил, основанных на реальных данных использования.

Похожие скиллы