Video: foundations
Video — foundations RFC
Status
*ccepted*— ratificada 20260509 (mesmo dia da abertura) como parte da onda piloto de bootstrap servicesai. Implementação iniciada em `servicesaivideo; tickets em servicesaivideobacklogpending/{001..005}`.
Summary
Foundation pra video understanding (transcrição, keyframe extraction, action recognition) e geração (proxy SoraVeoRunway via gateway, e selfhosted texttovideo local quando viável).
Motivation
Video é a próxima fronteira — Sora, Veo, Runway maduros em 2026. Koder Stack tem zero. Use cases: tutorial generation, screen recording analysis, ads.
Scope
In
- Transcription (delegando a
voice/pra audio track) - Key-frame extraction
- Scene segmentation
- Gen via proxy
Out (yet)
- Video editing pipeline (escopo de produto, não foundation)
- Live streaming
Initial design
Surfaces
backend/— Go API + worker batchapp/— não aplicável v1
Key APIs
POST /v1/video/analyze— pipeline completo de understandingPOST /v1/video/generate— proxy gen (SoraVeoRunway)POST /v1/video/keyframes— extração de frames-chave
Dependencies
services/ai/voice— audio track transcriptionservices/ai/imaging— frame analysisservices/ai/gateway— proxy geninfra/data/kdb-blob— storage
Relation to existing sectors
- Combina voice + imaging para análise multimodal de vídeo
- Independente de `products/media