Video: foundations

accepted

Video — foundations RFC

Status

*ccepted*— ratificada 20260509 (mesmo dia da abertura) como parte da onda piloto de bootstrap servicesai. Implementação iniciada em `servicesaivideo; tickets em servicesaivideobacklogpending/{001..005}`.

Summary

Foundation pra video understanding (transcrição, keyframe extraction, action recognition) e geração (proxy SoraVeoRunway via gateway, e selfhosted texttovideo local quando viável).

Motivation

Video é a próxima fronteira — Sora, Veo, Runway maduros em 2026. Koder Stack tem zero. Use cases: tutorial generation, screen recording analysis, ads.

Scope

In

  • Transcription (delegando a voice/ pra audio track)
  • Key-frame extraction
  • Scene segmentation
  • Gen via proxy

Out (yet)

  • Video editing pipeline (escopo de produto, não foundation)
  • Live streaming

Initial design

Surfaces

  • backend/ — Go API + worker batch
  • app/ — não aplicável v1

Key APIs

  • POST /v1/video/analyze — pipeline completo de understanding
  • POST /v1/video/generate — proxy gen (SoraVeoRunway)
  • POST /v1/video/keyframes — extração de frames-chave

Dependencies

  • services/ai/voice — audio track transcription
  • services/ai/imaging — frame analysis
  • services/ai/gateway — proxy gen
  • infra/data/kdb-blob — storage

Relation to existing sectors

  • Combina voice + imaging para análise multimodal de vídeo
  • Independente de `products/media

Source: ../home/koder/dev/koder/meta/docs/stack/rfcs/video-RFC-001-foundations.kmd