Data Science
Анализатор CSV-данных
coffeefuelbump/csv-data-summarizer-claude-skillClaude Skill для мгновенного анализа CSV-файлов: сводная статистика, обнаружение пропусков, корреляции и автоматические графики на основе pandas. Подходит для финансовых, клиентских, операционных и других данных.
Установка
terminal
bash
git clone https://github.com/coffeefuelbump/csv-data-summarizer-claude-skill.gitREADME
📊 Анализатор CSV-данных — Claude Skill
Мощный Claude Skill, который автоматически анализирует CSV-файлы и генерирует исчерпывающие выводы с визуализациями. Загрузите любой CSV — и получите мгновенный интеллектуальный анализ без лишних вопросов!
🚀 Возможности
- 🤖 Интеллектуальная адаптация — автоматически определяет тип данных (продажи, клиенты, финансы, опросы и др.) и применяет соответствующий анализ
- 📈 Комплексный анализ — генерирует статистику, корреляции, распределения и тренды
- 🎨 Автоматические визуализации — создаёт несколько графиков на основе содержимого данных:
- Временны́е ряды для данных с датами
- Тепловые карты корреляций для числовых зависимостей
- Гистограммы распределений
- Разбивка по категориям
- ⚡ Проактивность — никаких вопросов! Просто загрузите CSV и сразу получите полный анализ
- 🔍 Проверка качества данных — автоматически обнаруживает и сообщает о пропущенных значениях
- 📊 Поддержка множества отраслей — адаптируется к e-commerce, здравоохранению, финансам, операционной деятельности, опросам и другим сферам
📥 Быстрая загрузка
Начало работы за 2 шага
📦 Состав пакета
csv-data-summarizer-claude-skill/
├── SKILL.md # Определение Claude Skill
├── analyze.py # Движок комплексного анализа
├── requirements.txt # Зависимости Python
├── examples/
│ └── showcase_financial_pl_data.csv # Демо P&L финансовый датасет (15 месяцев, 25 метрик)
└── resources/
├── sample.csv # Пример датасета
└── README.md # Документация по использованию
🎯 Принцип работы
- Загрузите любой CSV-файл в Claude.ai
- Skill активируется автоматически при обнаружении CSV
- Анализ запускается немедленно — изучает структуру данных и адаптируется
- Результаты готовы — полный анализ с несколькими визуализациями
Никаких подсказок. Никакого выбора опций. Только мгновенные и исчерпывающие выводы!
📥 Установка
Для пользователей Claude.ai
- Скачайте последний релиз:
csv-data-summarizer.zip - Перейдите в Claude.ai → Settings → Capabilities → Skills
- Загрузите zip-файл
- Включите skill
- Готово! Загружайте любой CSV и наблюдайте за работой ✨
Для разработчиков
bash
git clone git@github.com:coffeefuelbump/csv-data-summarizer-claude-skill.git
cd csv-data-summarizer-claude-skill
pip install -r requirements.txt📊 Особенности демо-датасета
Включённый демо-CSV содержит 15 месяцев P&L-данных с:
- 3 продуктовыми линейками (SaaS, Enterprise, Services)
- 25 финансовыми метриками: выручка, расходы, маржа, CAC, LTV
- Квартальными трендами, отражающими рост бизнеса
- Идеально подходит для демонстрации анализа временны́х рядов, корреляций и финансовых инсайтов
🎨 Примеры применения
- 📊 Данные о продажах → тренды выручки, эффективность продуктов, региональный анализ
- 👥 Клиентские данные → демография, сегментация, географические паттерны
- 💰 Финансовые данные → анализ транзакций, обнаружение трендов, корреляции
- ⚙️ Операционные данные → метрики производительности, анализ временны́х рядов
- 📋 Данные опросов → распределение ответов, перекрёстные таблицы
🛠️ Технические детали
Зависимости:
- Python 3.8+
- pandas 2.0+
- matplotlib 3.7+
- seaborn 0.12+
Генерируемые визуализации:
- Графики трендов временны́х рядов
- Тепловые карты корреляций
- Гистограммы распределений
- Столбчатые диаграммы по категориям
📝 Пример вывода
============================================================
📊 DATA OVERVIEW
============================================================
Rows: 100 | Columns: 15
📋 DATA TYPES:
• order_date: object
• total_revenue: float64
• customer_segment: object
...
🔍 DATA QUALITY:
✓ No missing values - dataset is complete!
📈 NUMERICAL ANALYSIS:
[Summary statistics for all numeric columns]
🔗 CORRELATIONS:
[Correlation matrix showing relationships]
📅 TIME SERIES ANALYSIS:
Date range: 2024-01-05 to 2024-04-11
Span: 97 days
📊 VISUALIZATIONS CREATED:
✓ correlation_heatmap.png
✓ time_series_analysis.png
✓ distributions.png
✓ categorical_distributions.png