Создатель видеоподкастов
Agents365-ai/video-podcast-makerСкилл для coding-агентов: автоматически создаёт профессиональные видеоподкасты из темы. Поддерживает Bilibili, YouTube, Xiaohongshu, Douyin, WeChat Channels, 6 TTS-движков, 4K-рендеринг через Remotion и многоязычный вывод (zh-CN/en-US).
Установка
npx remotion studio src/remotion/index.tsREADME
Video Podcast Maker
Автоматизированный пайплайн для создания профессиональных видеоподкастов из заданной темы. Поддерживает Bilibili, YouTube, Xiaohongshu, Douyin и WeChat Channels с многоязычным выводом (zh-CN, en-US). Объединяет исследование темы, генерацию сценария, многодвижковый TTS (Edge/Azure/Doubao/CosyVoice), рендеринг видео через Remotion и микширование аудио через FFmpeg.
Работает с: Claude Code · OpenClaw (ClawHub) · OpenCode · Codex — любым coding-агентом с поддержкой SKILL.md
Публикация на: Bilibili · YouTube · Xiaohongshu · Douyin · WeChat Channels
Без написания кода! Просто опишите тему на обычном языке — coding-агент проведёт вас через каждый шаг в интерактивном режиме. Вы принимаете творческие решения, агент берёт на себя все технические детали. Создать первый видеоподкаст проще, чем кажется.
Примечание: Проект находится в активной разработке и может быть ещё не полностью зрелым. Мы постоянно итерируем и улучшаем его. Ваши отзывы и предложения очень ценны — не стесняйтесь открыть issue или написать нам!
Возможности
- Исследование темы — веб-поиск и сбор материала
- Написание сценария — структурированный нарратив с маркерами разделов
- Multi-TTS — Edge TTS (бесплатно), Azure Speech, Volcengine Doubao, CosyVoice, ElevenLabs, Google Cloud TTS, OpenAI TTS
- Remotion-видео — React-based композиция видео с анимациями
- Редактирование визуального стиля — настройка цветов, шрифтов и макета в Remotion Studio UI
- Предпросмотр в реальном времени — Remotion Studio для мгновенной отладки перед рендером
- Автосинхронизация — синхронизация аудио и видео через
timing.json - Микширование BGM — наложение фоновой музыки через FFmpeg
- Встраивание субтитров — опциональное встраивание SRT-субтитров
- Вывод 4K — разрешение 3840×2160 для чёткой загрузки
- Прогресс-бар глав — визуальная временная шкала с текущим разделом во время воспроизведения
- Двуязычный TTS — смешанный нарратив на китайском/английском через Azure Speech или CosyVoice
- Коррекция произношения — глобальные и проектные словари фонем для исправления китайских полифонов
- Шаблоны для Bilibili — готовые Remotion-шаблоны (
Video.tsx,Root.tsx,Thumbnail.tsx,podcast.txt) для быстрого старта проекта - Библиотека компонентов — переиспользуемые визуальные блоки (ComparisonCard, Timeline, CodeBlock, QuoteBlock, FeatureGrid, DataBar, StatCounter, FlowChart, IconCard, DiagramReveal, AudioWaveform, LottieAnimation, MediaSection, SectionLayouts, AnimatedBackground) для создания насыщенных макетов разделов
- Обучение предпочтениям — автоматически запоминает пользовательские предпочтения по стилю (цвета, шрифты, скорость речи) и применяет их к будущим видео
- Мультиплатформенность — Bilibili, YouTube, Xiaohongshu, Douyin и WeChat Channels с независимыми настройками платформы и языка
- Многоязычность — шаблоны сценариев, голоса TTS и шрифты субтитров для китайского (zh-CN) и английского (en-US)
- Настройки субтитров — шрифт, размер, цвет, обводка; включение/отключение встраивания субтитров
- Настраиваемый CTA — авто (тройной лайк Bilibili / подписка YouTube), анимация, текст или произвольный вариант
Оптимизации под платформы
Bilibili:
- Структура сценария — приветственное вступление + призыв к действию в конце (一键三连)
- Временны́е метки глав — автогенерация в формате
MM:SSдля глав B站 - Генерация превью — AI (imagen/imagenty) или Remotion, автоматически создаёт версии 16:9 и 4:3
- Визуальный стиль — жирный текст, минимум отступов, высокая информационная плотность
- Публикационная информация — формулы заголовков, стратегии тегов, шаблоны описаний
YouTube:
- SEO-оптимизация — заголовок до 70 символов, насыщенное ключевыми словами описание, теги и хэштеги
- Главы — автогенерация временны́х меток глав YouTube (первая строка на 0:00)
- CTA — текстовая анимация «Like, Subscribe & Share» или произвольный вариант
Xiaohongshu (小红书):
- Заголовок — максимум 20 символов, ёмкий, с поддержкой эмодзи
- Описание — 200–500 символов, стиль 种草/обмена знаниями с эмодзи
- Хэштеги — формат
#话题#(двойной хэш), 5–10 тегов - Превью — 3:4 (1080×1440) для оптимизации в ленте
- CTA — текстовая анимация «点赞收藏加关注»
Douyin (抖音):
- Формат — только вертикальные короткие видео (9:16), горизонтальный длинный формат не поддерживается
- Описание — 100–200 символов, непринуждённый разговорный стиль с эмодзи
- Хэштеги — формат
#话题(одинарный хэш), 3–8 тегов - CTA — только текст «点赞关注» (без анимации)
WeChat Channels (微信视频号):
- Формат — только вертикальные короткие видео (9:16), горизонтальный длинный формат не поддерживается
- Описание — 100–300 символов, стиль обмена знаниями для репостов
- Хэштеги — формат
#话题(одинарный хэш), 3–8 тегов - CTA — только текст «点赞关注,转发给朋友» (без анимации)
Рабочий процесс

Связанные скиллы
Этот скилл зависит от remotion-best-practices и работает совместно с другими опциональными скиллами:
- remotion-best-practices — официальные лучшие практики Remotion (обязательно; предоставляет базовые паттерны и рекомендации Remotion)
- find-skills — официальный инструмент поиска скиллов (опционально; помогает находить и устанавливать дополнительные скиллы)
- ffmpeg — расширенная обработка аудио/видео (опционально)
- imagen / imagenty — AI-генерация превью (опционально)
Требования
Системные требования
| ПО | Версия | Назначение |
|---|---|---|
| macOS / Linux | — | Протестировано на macOS, совместимо с Linux |
| Python | 3.8+ | TTS-скрипт, автоматизация |
| Node.js | 18+ | Рендеринг видео через Remotion |
| FFmpeg | 4.0+ | Обработка аудио/видео |
Установка
# macOS
brew install ffmpeg node python3
# Ubuntu/Debian
sudo apt install ffmpeg nodejs python3 python3-pip
# Python-зависимости
pip install azure-cognitiveservices-speech dashscope edge-tts requestsНастройка проекта (обязательно)
Важно: Этот скилл требует Remotion-проект в качестве основы.
Описание компонентов:
| Компонент | Источник | Назначение |
|---|---|---|
| Remotion-проект | Создаётся агентом | Основа для рендеринга видео |
| Скрипты скилла | Этот репозиторий | TTS, синхронизация, публикация |
| Ваш контент | Генерируется агентом | Сценарий, аудио, финальное видео |