Claude Info
Data Science

Навыки дата-инжиниринга

AltimateAI/data-engineering-skills

Набор навыков Claude Code для аналитических инженеров: создание и отладка dbt-моделей, оптимизация Snowflake-запросов. Повышает точность на ADE-bench до 53%, ускоряет создание моделей в 3 раза.

Установка

terminal
bash
git clone https://github.com/AltimateAI/data-engineering-skills.git

README

Навыки дата-инжиниринга

Навыки Claude Code для аналитических и data-инженеров, работающих с dbt и Snowflake

License: MIT Claude Code

Altimate Data Skills — коллекция навыков Claude Code, которые кодируют рабочие процессы и лучшие практики опытных аналитических инженеров. Эти навыки превращают Claude из генератора кода в полноценного ассистента по дата-инжинирингу.

Ключевые результаты

  • 53% точности на ADE-bench (43 реальные dbt-задачи)
  • Улучшение в 3 раза на задачах создания моделей по сравнению с базовым уровнем
  • 84% успешных прогонов при оптимизации Snowflake-запросов (62 TPC-H запроса, датасет 1 ТБ)
  • Прирост производительности в 3,6 раза по сравнению с базовым уровнем (16,8% среднее улучшение против 4,7%)
  • Навыки учат Claude как работать, а не только что писать

Быстрый старт

/plugin marketplace add AltimateAI/data-engineering-skills

Установка отдельных пакетов навыков:

bash
# Установить навыки dbt
/plugin install dbt-skills@data-engineering-skills

# Установить навыки Snowflake
/plugin install snowflake-skills@data-engineering-skills

Доступные навыки

Навыки dbt

НавыкНазначениеКлючевые действия
creating-dbt-modelsСоздание моделейИзучение соглашений → Написание → Сборка → Проверка результата
debugging-dbt-errorsУстранение ошибокЧтение полной ошибки → Проверка upstream → Применение исправления → Пересборка
testing-dbt-modelsСхемные тестыИзучение существующих паттернов тестов → Соответствие стилю проекта
documenting-dbt-modelsДокументацияАнализ модели → Генерация описаний
migrating-sql-to-dbtКонвертация legacy SQLРазбор SQL → Создание корректной dbt-модели
refactoring-dbt-modelsБезопасный рефакторингОтслеживание зависимостей → Применение изменений → Проверка downstream
developing-incremental-modelsИнкрементальные моделиВыбор стратегии → Проектирование unique_key → Обработка граничных случаев

Навыки Snowflake

НавыкНазначениеКлючевые действия
finding-expensive-queriesАнализ стоимостиПоиск и ранжирование запросов по стоимости/времени/объёму данных
optimizing-query-by-idОптимизация производительностиОптимизация по ID запроса из истории
optimizing-query-textОптимизация производительностиПрофилирование запроса → Выявление узких мест → Применение паттернов

Как работают навыки

Навыки — это markdown-файлы, которые учат Claude как подходить к задачам, а не только какой синтаксис использовать. Каждый навык состоит из двух частей:

1. Условия активации

Когда должен активироваться навык?

yaml
---
name: creating-dbt-models
description: |
  Guide for creating dbt models. ALWAYS use this skill when:
  (1) Creating ANY new model (staging, intermediate, mart)
  (2) Task mentions "create", "build", "add" with model/table
  (3) Modifying model logic or columns
---

2. Инструкции по рабочему процессу

Какие шаги должен выполнять Claude?

markdown
# dbt Model Development

**Read before you write. Build after you write. Verify your output.**

## Critical Rules
1. ALWAYS run `dbt build` after creating models - compile is NOT enough
2. ALWAYS verify output after build using `dbt show`
3. If build fails 3+ times, stop and reassess your approach
...

Примеры использования

Навыки активируются автоматически на основе вашего запроса:

Ваш запросАктивируемый навык
«Создай новую модель orders»creating-dbt-models
«Исправь эту ошибку компиляции»debugging-dbt-errors
«Добавь тесты к модели customers»testing-dbt-models
«Задокументируй метрики выручки»documenting-dbt-models
«Создай инкрементальную модель для событий»developing-incremental-models
«Этот запрос медленный, оптимизируй его»optimizing-query-text

Совместное использование с Altimate MCP Tools

Навыки становятся ещё мощнее в сочетании с MCP-сервером Altimate. MCP-сервер предоставляет доступ в реальном времени к вашему dbt-проекту и хранилищу данных:

MCP-инструментЧто предоставляет
dbt_project_infoСтруктура проекта, список моделей, источники
dbt_model_detailsТипы столбцов, зависимости, скомпилированный SQL
dbt_compileКомпиляция моделей без CLI
snowflake_query_historyПоследние выполнения запросов и статистика
snowflake_table_statsКоличество строк, информация о кластеризации

Киты

Киты объединяют навыки, MCP-серверы и инструкции в единый активируемый блок. Вместо установки навыков по одному активируйте кит и получите полноценную среду разработки.

Доступные киты

КитОписаниеНавыкиMCP
dbt-snowflakeПолная настройка dbt + Snowflake9 навыковdbt MCP-сервер

Быстрый старт

bash
# Установить кит
altimate-code kit install AltimateAI/data-engineering-skills

# Активировать для вашего проекта
altimate-code kit activate dbt-snowflake

# Проверить активные компоненты
altimate-code kit status

См. kits/README.md для полного справочника формата китов и инструкций по созданию собственных.

Результаты бенчмарков

Оценка проводилась с использованием ADE-bench — фреймворка для оценки AI-агентов на задачах аналитической инженерии. Все тесты выполнялись на Claude Sonnet 4.5.

Общие результаты

КонфигурацияТочностьРешённые задачи
Базовый Claude (без навыков)46,5%20/43
Claude + навыки53,5%23/43

Результаты по категориям задач

КатегорияБазовыйС навыкамиУлучшение
Создание моделей40%65%+25 пп
Исправление ошибок60%70%+10 пп
Отладка35%50%+15 пп
Рефакторинг30%35%+5 пп
Анализ25%30%+5 пп

Оптимизация Snowflake-запросов (TPC-H SF1000)

Бенчмарк на датасете TPC-H 1 ТБ (62 запроса)

Похожие скиллы