Claude Info
AI и агенты

Создатель видеоподкастов

Agents365-ai/video-podcast-maker

Скилл для coding-агентов: автоматически создаёт профессиональные видеоподкасты из темы. Поддерживает Bilibili, YouTube, Xiaohongshu, Douyin, WeChat Channels, 6 TTS-движков, 4K-рендеринг через Remotion и многоязычный вывод (zh-CN/en-US).

Установка

terminal
bash
npx remotion studio src/remotion/index.ts

README

Video Podcast Maker

中文文档

Автоматизированный пайплайн для создания профессиональных видеоподкастов из заданной темы. Поддерживает Bilibili, YouTube, Xiaohongshu, Douyin и WeChat Channels с многоязычным выводом (zh-CN, en-US). Объединяет исследование темы, генерацию сценария, многодвижковый TTS (Edge/Azure/Doubao/CosyVoice), рендеринг видео через Remotion и микширование аудио через FFmpeg.

Работает с: Claude Code · OpenClaw (ClawHub) · OpenCode · Codex — любым coding-агентом с поддержкой SKILL.md

Публикация на: Bilibili · YouTube · Xiaohongshu · Douyin · WeChat Channels

Без написания кода! Просто опишите тему на обычном языке — coding-агент проведёт вас через каждый шаг в интерактивном режиме. Вы принимаете творческие решения, агент берёт на себя все технические детали. Создать первый видеоподкаст проще, чем кажется.

Примечание: Проект находится в активной разработке и может быть ещё не полностью зрелым. Мы постоянно итерируем и улучшаем его. Ваши отзывы и предложения очень ценны — не стесняйтесь открыть issue или написать нам!

Возможности

  • Исследование темы — веб-поиск и сбор материала
  • Написание сценария — структурированный нарратив с маркерами разделов
  • Multi-TTS — Edge TTS (бесплатно), Azure Speech, Volcengine Doubao, CosyVoice, ElevenLabs, Google Cloud TTS, OpenAI TTS
  • Remotion-видео — React-based композиция видео с анимациями
  • Редактирование визуального стиля — настройка цветов, шрифтов и макета в Remotion Studio UI
  • Предпросмотр в реальном времени — Remotion Studio для мгновенной отладки перед рендером
  • Автосинхронизация — синхронизация аудио и видео через timing.json
  • Микширование BGM — наложение фоновой музыки через FFmpeg
  • Встраивание субтитров — опциональное встраивание SRT-субтитров
  • Вывод 4K — разрешение 3840×2160 для чёткой загрузки
  • Прогресс-бар глав — визуальная временная шкала с текущим разделом во время воспроизведения
  • Двуязычный TTS — смешанный нарратив на китайском/английском через Azure Speech или CosyVoice
  • Коррекция произношения — глобальные и проектные словари фонем для исправления китайских полифонов
  • Шаблоны для Bilibili — готовые Remotion-шаблоны (Video.tsx, Root.tsx, Thumbnail.tsx, podcast.txt) для быстрого старта проекта
  • Библиотека компонентов — переиспользуемые визуальные блоки (ComparisonCard, Timeline, CodeBlock, QuoteBlock, FeatureGrid, DataBar, StatCounter, FlowChart, IconCard, DiagramReveal, AudioWaveform, LottieAnimation, MediaSection, SectionLayouts, AnimatedBackground) для создания насыщенных макетов разделов
  • Обучение предпочтениям — автоматически запоминает пользовательские предпочтения по стилю (цвета, шрифты, скорость речи) и применяет их к будущим видео
  • Мультиплатформенность — Bilibili, YouTube, Xiaohongshu, Douyin и WeChat Channels с независимыми настройками платформы и языка
  • Многоязычность — шаблоны сценариев, голоса TTS и шрифты субтитров для китайского (zh-CN) и английского (en-US)
  • Настройки субтитров — шрифт, размер, цвет, обводка; включение/отключение встраивания субтитров
  • Настраиваемый CTA — авто (тройной лайк Bilibili / подписка YouTube), анимация, текст или произвольный вариант

Оптимизации под платформы

Bilibili:

  • Структура сценария — приветственное вступление + призыв к действию в конце (一键三连)
  • Временны́е метки глав — автогенерация в формате MM:SS для глав B站
  • Генерация превью — AI (imagen/imagenty) или Remotion, автоматически создаёт версии 16:9 и 4:3
  • Визуальный стиль — жирный текст, минимум отступов, высокая информационная плотность
  • Публикационная информация — формулы заголовков, стратегии тегов, шаблоны описаний

YouTube:

  • SEO-оптимизация — заголовок до 70 символов, насыщенное ключевыми словами описание, теги и хэштеги
  • Главы — автогенерация временны́х меток глав YouTube (первая строка на 0:00)
  • CTA — текстовая анимация «Like, Subscribe & Share» или произвольный вариант

Xiaohongshu (小红书):

  • Заголовок — максимум 20 символов, ёмкий, с поддержкой эмодзи
  • Описание — 200–500 символов, стиль 种草/обмена знаниями с эмодзи
  • Хэштеги — формат #话题# (двойной хэш), 5–10 тегов
  • Превью — 3:4 (1080×1440) для оптимизации в ленте
  • CTA — текстовая анимация «点赞收藏加关注»

Douyin (抖音):

  • Формат — только вертикальные короткие видео (9:16), горизонтальный длинный формат не поддерживается
  • Описание — 100–200 символов, непринуждённый разговорный стиль с эмодзи
  • Хэштеги — формат #话题 (одинарный хэш), 3–8 тегов
  • CTA — только текст «点赞关注» (без анимации)

WeChat Channels (微信视频号):

  • Формат — только вертикальные короткие видео (9:16), горизонтальный длинный формат не поддерживается
  • Описание — 100–300 символов, стиль обмена знаниями для репостов
  • Хэштеги — формат #话题 (одинарный хэш), 3–8 тегов
  • CTA — только текст «点赞关注,转发给朋友» (без анимации)

Рабочий процесс

Workflow

Связанные скиллы

Этот скилл зависит от remotion-best-practices и работает совместно с другими опциональными скиллами:

  • remotion-best-practices — официальные лучшие практики Remotion (обязательно; предоставляет базовые паттерны и рекомендации Remotion)
  • find-skills — официальный инструмент поиска скиллов (опционально; помогает находить и устанавливать дополнительные скиллы)
  • ffmpeg — расширенная обработка аудио/видео (опционально)
  • imagen / imagenty — AI-генерация превью (опционально)

Требования

Системные требования

ПОВерсияНазначение
macOS / LinuxПротестировано на macOS, совместимо с Linux
Python3.8+TTS-скрипт, автоматизация
Node.js18+Рендеринг видео через Remotion
FFmpeg4.0+Обработка аудио/видео

Установка

bash
# macOS
brew install ffmpeg node python3

# Ubuntu/Debian
sudo apt install ffmpeg nodejs python3 python3-pip

# Python-зависимости
pip install azure-cognitiveservices-speech dashscope edge-tts requests

Настройка проекта (обязательно)

Важно: Этот скилл требует Remotion-проект в качестве основы.

Описание компонентов:

КомпонентИсточникНазначение
Remotion-проектСоздаётся агентомОснова для рендеринга видео
Скрипты скиллаЭтот репозиторийTTS, синхронизация, публикация
Ваш контентГенерируется агентомСценарий, аудио, финальное видео

Похожие скиллы