SkillCompass
Evol-ai/SkillCompassИнструмент для оценки и управления качеством скиллов Claude Code и OpenClaw. Шестимерная система оценки, отслеживание использования, направленное улучшение и верификация изменений. Для разработчиков, которым нужна измеримая качество агентных скиллов.
Установка
npx skills add Evol-ai/SkillCompassREADME
| Что это | Локальный инструмент оценки качества скиллов и управления ими для Claude Code / OpenClaw. Шестимерная система оценки, предложения на основе статистики использования, управляемое улучшение, отслеживание версий. |
| Какую проблему решает | Превращает подход «правлю наугад и надеюсь» в цикл: диагностика → точечное исправление → подтверждённое улучшение. Превращает «установил и забыл» в постоянную видимость того, что работает, что устарело и что несёт риски. |
| Запуск за 30 секунд | /skillcompass — общий обзор состояния скиллов. /eval-skill {path} — мгновенный отчёт о качестве с указанием слабейшего места и следующего шага. |
Оцени → найди слабое звено → исправь → докажи результат → следующая слабость → повторяй. Тем временем Skill Inbox отслеживает использование и сообщает, что требует внимания.
Для кого этот инструмент
Подходит
- Всем, кто поддерживает агентные скиллы и хочет измеримого качества
- Разработчикам, которым нужно направленное улучшение — не угадывание, а точное знание, какое измерение исправлять следующим
- Командам, которым нужен quality gate — любой инструмент, редактирующий скилл, запускает автоматическую оценку
- Пользователям, установившим много скиллов и нуждающимся в видимости того, что реально используется, что устарело и что несёт риски
Не подходит
- Для общего code review или отладки в runtime
- Для создания новых скиллов с нуля (используйте skill-creator)
- Для оценки файлов, не являющихся скиллами
Быстрый старт
Требования: Claude Opus 4.6 (сложные рассуждения + стабильная оценка) · Node.js v18+ (локальные валидаторы)
Установка одной командой (рекомендуется)
npx skills add Evol-ai/SkillCompass
Поддерживает 45+ агентов, включая Claude Code, Codex, Cursor, Cline, Gemini CLI, GitHub Copilot и другие. CLI автоматически определяет установленных агентов и размещает скилл в нужном месте.
Claude Code (ручная установка)
git clone https://github.com/Evol-ai/SkillCompass.git
cd SkillCompass && npm install
# На уровне пользователя (все проекты)
rsync -a --exclude='.git' . ~/.claude/skills/skill-compass/
# Или на уровне проекта (только текущий проект)
rsync -a --exclude='.git' . .claude/skills/skill-compass/Первый запуск: SkillCompass автоматически запускает краткое знакомство — сканирует установленные скиллы (~5 секунд), предлагает настройку statusLine, затем возвращает управление. Claude Code запросит разрешение на выполнение команд
node; выберите «Allow always», чтобы избежать повторных запросов.
OpenClaw
git clone https://github.com/Evol-ai/SkillCompass.git
cd SkillCompass && npm install
# Следуйте документации OpenClaw по установке скиллов для вашей конфигурации
rsync -a --exclude='.git' . <your-openclaw-skills-path>/skill-compass/Если ваши скиллы OpenClaw находятся за пределами корневых директорий сканирования по умолчанию, добавьте их в skills.load.extraDirs в файле ~/.openclaw/openclaw.json:
{
"skills": {
"load": {
"extraDirs": ["<your-openclaw-skills-path>"]
}
}
}Использование
/skillcompass — единая точка входа. Используйте slash-команду или просто говорите естественным языком — оба варианта работают:
/skillcompass → обзор того, что требует внимания
/skillcompass evaluate my-skill → шестимерный отчёт о качестве
"improve the nano-banana skill" → исправить слабейшее измерение, верифицировать, следующее
"what skills haven't I used recently?" → аналитика на основе использования
"security scan this skill" → углублённый аудит безопасности D3
Что умеет инструмент
Оценка — не самоцель, важно направление. Вы мгновенно видите, какое измерение является узким местом и что с этим делать.
Каждый цикл /eval-improve следует замкнутому контуру: исправить слабейшее → переоценить → подтвердить улучшение → следующее слабейшее. Ни одно исправление не сохраняется, пока повторная оценка не подтвердит его эффективность.
Шестимерная модель оценки
| ID | Измерение | Вес | Что оценивается |
|---|---|---|---|
| D1 | Структура | 10% | Валидность frontmatter, формат markdown, объявления |
| D2 | Триггер | 15% | Качество активации, точность отклонения, обнаруживаемость |
| D3 | Безопасность | 20% | Секреты, инъекции, разрешения, утечка данных, встроенные shell-команды |
| D4 | Функциональность | 30% | Базовое качество, граничные случаи, стабильность вывода, обработка ошибок |
| D5 | Сравнительная | 15% | Ценность по сравнению с прямым промптингом (со скиллом и без) |
| D6 | Уникальность | 10% | Пересечение с похожими скиллами, риск вытеснения моделью |
overall_score = round((D1×0.10 + D2×0.15 + D3×0.20 + D4×0.30 + D5×0.15 + D6×0.10) × 10)
| Вердикт | Условие |
|---|---|
| PASS | score >= 70 И D3 pass |
| CAUTION | 50–69, или D3 High findings |
| FAIL | score < 50, или D3 Critical (принудительный gate) |
Skill Inbox — предложения на основе использования
SkillCompass пассивно отслеживает, какие скиллы вы реально используете, и выдаёт предложения, когда что-то требует внимания — неиспользуемые скиллы, устаревшие оценки, снижение активности, доступные обновления и многое другое. 9 встроенных правил, основанных на реальных данных использования.