Автоматический конвейер: подкасты, лекции, стримы превращаются в вертикальные YouTube Shorts с AI-субтитрами, B-roll и обложкой. Загружаешь файл — получаешь публикацию.
Никаких ручных монтажей, ASS-файлов и FFmpeg-команд. Положил видео в папку — через 5 минут оно опубликовано на канале с заголовком, описанием и тегами.
Groq Whisper расшифровывает аудио со word-level таймингами для точных субтитров.
Gemini 2.0 Flash находит самые цепляющие моменты, генерирует заголовок, описание и теги.
fal.ai Flux-2 Turbo рисует тематические вставки, Ken Burns добавляет движение.
Word-level karaoke ASS — слова появляются и подсвечиваются ровно по бит аудио.
Автоматическая генерация thumbnail с заголовком, рамкой и контрастной палитрой.
Прямая публикация в YouTube + Telegram-уведомления о каждой стадии.
Один daemon следит за Я.Диском. Каждый новый файл проходит весь конвейер автоматически.
Опрос папки каждые 60 секунд, скачивание новых mp4 в очередь обработки.
Whisper расшифровывает аудио, Gemini выбирает 1-3 самых сильных смысловых блока для нарезки в Shorts.
Для каждой смысловой вставки рисуется AI-изображение под промт сцены, накладывается Ken Burns-движение и crossfade.
FFmpeg single-pass: обрезка по timestamps, ASS-субтитры, вставки B-roll, обложка, цветокор. На выходе 1080×1920 H.264 high@CRF 12.
Автозалив на YouTube с заголовком/описанием/тегами от LLM. Telegram-уведомления о каждой стадии и ежедневный отчёт по аналитике канала.
Ставишь один раз — публикуется само. Вместо двух часов в Premiere Pro на каждый Shorts — минуты твоего внимания на отбор исходников.
Каждый параметр настраивается, каждая стадия логируется, каждое падение видно в дашборде.
Каждое слово анимируется отдельно по тайм-кодам Whisper.
Авто-отбраковка изображений с низким контрастом и saturation, retry с альтернативной моделью.
Готовые пресеты thumbnail'ов с автоматической подгонкой текста.
Сообщение на каждом этапе: download, transcribe, render, upload, success.
Ежедневный TG-отчёт: подписчики, просмотры, топ видео.
FastAPI + React: статус pipeline, история прогонов, конфиг рендера, B-roll preview.
Brightness / contrast / saturation / gamma настраиваются из дашборда.
JSONL-журнал с длительностями и стоимостью каждой стадии.