v2.0 · Production

Длинное видео готовый Shorts
в один клик на Я.Диск

Автоматический конвейер: подкасты, лекции, стримы превращаются в вертикальные YouTube Shorts с AI-субтитрами, B-roll и обложкой. Загружаешь файл — получаешь публикацию.

Полный цикл — от исходника до публикации

Никаких ручных монтажей, ASS-файлов и FFmpeg-команд. Положил видео в папку — через 5 минут оно опубликовано на канале с заголовком, описанием и тегами.

🎙️

AI-транскрипция

Groq Whisper расшифровывает аудио со word-level таймингами для точных субтитров.

🧠

Умный отбор

Gemini 2.0 Flash находит самые цепляющие моменты, генерирует заголовок, описание и теги.

🎬

AI B-roll

fal.ai Flux-2 Turbo рисует тематические вставки, Ken Burns добавляет движение.

Прыгающие субтитры

Word-level karaoke ASS — слова появляются и подсвечиваются ровно по бит аудио.

🖼️

Обложка по шаблону

Автоматическая генерация thumbnail с заголовком, рамкой и контрастной палитрой.

📤

Auto-upload

Прямая публикация в YouTube + Telegram-уведомления о каждой стадии.

5 этапов, ноль вмешательства

Один daemon следит за Я.Диском. Каждый новый файл проходит весь конвейер автоматически.

1

Watcher слушает Я.Диск

Опрос папки каждые 60 секунд, скачивание новых mp4 в очередь обработки.

yadisk_watcher.py · /ShortsForge/Upload
2

Транскрипция и LLM-отбор

Whisper расшифровывает аудио, Gemini выбирает 1-3 самых сильных смысловых блока для нарезки в Shorts.

Groq Whisper Large · Gemini 2.0 Flash
3

Генерация B-roll

Для каждой смысловой вставки рисуется AI-изображение под промт сцены, накладывается Ken Burns-движение и crossfade.

fal.ai Flux-2 Turbo · Ken Burns 1.45×
4

Сборка и рендер

FFmpeg single-pass: обрезка по timestamps, ASS-субтитры, вставки B-roll, обложка, цветокор. На выходе 1080×1920 H.264 high@CRF 12.

FFmpeg · ASS karaoke · 1080×1920 · CRF 12
5

Публикация и нотификация

Автозалив на YouTube с заголовком/описанием/тегами от LLM. Telegram-уведомления о каждой стадии и ежедневный отчёт по аналитике канала.

YouTube Data API v3 · Telegram Bot API

Конвейер, а не редактор

Ставишь один раз — публикуется само. Вместо двух часов в Premiere Pro на каждый Shorts — минуты твоего внимания на отбор исходников.

~5 мин
от загрузки до публикации
$0.05
средняя стоимость одного Shorts
96.7%
успешных прогонов
0
кликов после загрузки на Я.Диск

Не «AI-инструмент», а отлаженный продакшн

Каждый параметр настраивается, каждая стадия логируется, каждое падение видно в дашборде.

Word-level karaoke ASS

Каждое слово анимируется отдельно по тайм-кодам Whisper.

Валидация B-roll

Авто-отбраковка изображений с низким контрастом и saturation, retry с альтернативной моделью.

Шаблонные обложки

Готовые пресеты thumbnail'ов с автоматической подгонкой текста.

Telegram-нотификации

Сообщение на каждом этапе: download, transcribe, render, upload, success.

Аналитика канала

Ежедневный TG-отчёт: подписчики, просмотры, топ видео.

Live-дашборд

FastAPI + React: статус pipeline, история прогонов, конфиг рендера, B-roll preview.

Цветокоррекция

Brightness / contrast / saturation / gamma настраиваются из дашборда.

Stage events log

JSONL-журнал с длительностями и стоимостью каждой стадии.