Навыки дата-инжиниринга
AltimateAI/data-engineering-skillsНабор навыков Claude Code для аналитических инженеров: создание и отладка dbt-моделей, оптимизация Snowflake-запросов. Повышает точность на ADE-bench до 53%, ускоряет создание моделей в 3 раза.
Установка
git clone https://github.com/AltimateAI/data-engineering-skills.gitREADME
Навыки дата-инжиниринга
Навыки Claude Code для аналитических и data-инженеров, работающих с dbt и Snowflake
Altimate Data Skills — коллекция навыков Claude Code, которые кодируют рабочие процессы и лучшие практики опытных аналитических инженеров. Эти навыки превращают Claude из генератора кода в полноценного ассистента по дата-инжинирингу.
Ключевые результаты
- 53% точности на ADE-bench (43 реальные dbt-задачи)
- Улучшение в 3 раза на задачах создания моделей по сравнению с базовым уровнем
- 84% успешных прогонов при оптимизации Snowflake-запросов (62 TPC-H запроса, датасет 1 ТБ)
- Прирост производительности в 3,6 раза по сравнению с базовым уровнем (16,8% среднее улучшение против 4,7%)
- Навыки учат Claude как работать, а не только что писать
Быстрый старт
/plugin marketplace add AltimateAI/data-engineering-skills
Установка отдельных пакетов навыков:
# Установить навыки dbt
/plugin install dbt-skills@data-engineering-skills
# Установить навыки Snowflake
/plugin install snowflake-skills@data-engineering-skillsДоступные навыки
Навыки dbt
| Навык | Назначение | Ключевые действия |
|---|---|---|
| creating-dbt-models | Создание моделей | Изучение соглашений → Написание → Сборка → Проверка результата |
| debugging-dbt-errors | Устранение ошибок | Чтение полной ошибки → Проверка upstream → Применение исправления → Пересборка |
| testing-dbt-models | Схемные тесты | Изучение существующих паттернов тестов → Соответствие стилю проекта |
| documenting-dbt-models | Документация | Анализ модели → Генерация описаний |
| migrating-sql-to-dbt | Конвертация legacy SQL | Разбор SQL → Создание корректной dbt-модели |
| refactoring-dbt-models | Безопасный рефакторинг | Отслеживание зависимостей → Применение изменений → Проверка downstream |
| developing-incremental-models | Инкрементальные модели | Выбор стратегии → Проектирование unique_key → Обработка граничных случаев |
Навыки Snowflake
| Навык | Назначение | Ключевые действия |
|---|---|---|
| finding-expensive-queries | Анализ стоимости | Поиск и ранжирование запросов по стоимости/времени/объёму данных |
| optimizing-query-by-id | Оптимизация производительности | Оптимизация по ID запроса из истории |
| optimizing-query-text | Оптимизация производительности | Профилирование запроса → Выявление узких мест → Применение паттернов |
Как работают навыки
Навыки — это markdown-файлы, которые учат Claude как подходить к задачам, а не только какой синтаксис использовать. Каждый навык состоит из двух частей:
1. Условия активации
Когда должен активироваться навык?
---
name: creating-dbt-models
description: |
Guide for creating dbt models. ALWAYS use this skill when:
(1) Creating ANY new model (staging, intermediate, mart)
(2) Task mentions "create", "build", "add" with model/table
(3) Modifying model logic or columns
---2. Инструкции по рабочему процессу
Какие шаги должен выполнять Claude?
# dbt Model Development
**Read before you write. Build after you write. Verify your output.**
## Critical Rules
1. ALWAYS run `dbt build` after creating models - compile is NOT enough
2. ALWAYS verify output after build using `dbt show`
3. If build fails 3+ times, stop and reassess your approach
...Примеры использования
Навыки активируются автоматически на основе вашего запроса:
| Ваш запрос | Активируемый навык |
|---|---|
| «Создай новую модель orders» | creating-dbt-models |
| «Исправь эту ошибку компиляции» | debugging-dbt-errors |
| «Добавь тесты к модели customers» | testing-dbt-models |
| «Задокументируй метрики выручки» | documenting-dbt-models |
| «Создай инкрементальную модель для событий» | developing-incremental-models |
| «Этот запрос медленный, оптимизируй его» | optimizing-query-text |
Совместное использование с Altimate MCP Tools
Навыки становятся ещё мощнее в сочетании с MCP-сервером Altimate. MCP-сервер предоставляет доступ в реальном времени к вашему dbt-проекту и хранилищу данных:
| MCP-инструмент | Что предоставляет |
|---|---|
dbt_project_info | Структура проекта, список моделей, источники |
dbt_model_details | Типы столбцов, зависимости, скомпилированный SQL |
dbt_compile | Компиляция моделей без CLI |
snowflake_query_history | Последние выполнения запросов и статистика |
snowflake_table_stats | Количество строк, информация о кластеризации |
Киты
Киты объединяют навыки, MCP-серверы и инструкции в единый активируемый блок. Вместо установки навыков по одному активируйте кит и получите полноценную среду разработки.
Доступные киты
| Кит | Описание | Навыки | MCP |
|---|---|---|---|
| dbt-snowflake | Полная настройка dbt + Snowflake | 9 навыков | dbt MCP-сервер |
Быстрый старт
# Установить кит
altimate-code kit install AltimateAI/data-engineering-skills
# Активировать для вашего проекта
altimate-code kit activate dbt-snowflake
# Проверить активные компоненты
altimate-code kit statusСм. kits/README.md для полного справочника формата китов и инструкций по созданию собственных.
Результаты бенчмарков
Оценка проводилась с использованием ADE-bench — фреймворка для оценки AI-агентов на задачах аналитической инженерии. Все тесты выполнялись на Claude Sonnet 4.5.
Общие результаты
| Конфигурация | Точность | Решённые задачи |
|---|---|---|
| Базовый Claude (без навыков) | 46,5% | 20/43 |
| Claude + навыки | 53,5% | 23/43 |
Результаты по категориям задач
| Категория | Базовый | С навыками | Улучшение |
|---|---|---|---|
| Создание моделей | 40% | 65% | +25 пп |
| Исправление ошибок | 60% | 70% | +10 пп |
| Отладка | 35% | 50% | +15 пп |
| Рефакторинг | 30% | 35% | +5 пп |
| Анализ | 25% | 30% | +5 пп |
Оптимизация Snowflake-запросов (TPC-H SF1000)
Бенчмарк на датасете TPC-H 1 ТБ (62 запроса)