Imaging: foundations
Imaging — foundations RFC
Status
*ccepted*— ratificada 20260509 (mesmo dia da abertura) como parte da onda piloto de bootstrap servicesai. Implementação iniciada em `servicesaiimaging; tickets em servicesaiimagingbacklogpending/{001..005}`.
Summary
Foundation pra geração de imagem (texttoimage, imagetoimage, inpainting). Selfhosted Stable Diffusion XL/3 + proxy pra DALLEImagenMidjourney via gateway.
Motivation
Geração de imagem é core hoje (marketing, mockup, icon variants, OG images dinâmicas como em landing-pages/packages.kmd). Hoje zero foundation; cada produto chama provider externo direto.
Scope
In
- Txt2img (text
toimage) - Img2img (image
toimage) - Inpainting
- Upscaling
- Asset OG composer (consumido por
landing-pages/packages.kmd)
Out (yet)
- Video gen (→
video) - 3D mesh gen (→
scene3d) - Avatar gen (sub-tópico futuro)
Initial design
Surfaces
backend/— Go API + worker GPUapp/— não aplicável v1
Key APIs
POST /v1/imaging/generate— txt2imgPOST /v1/imaging/edit— img2img + inpaintingPOST /v1/imaging/upscale— super-resolution
Dependencies
services/ai/gateway— proxy pra DALL-EImagenMidjourneyservices/ai/runtime— SDXL/SD3 localinfra/data/kdb-blob— storage de assets gerados
Relation to existing sectors
- Complementa
vision(input) com output - Será consumido por
meta/sites/(OG composition) e produtos de marketing
Selfhostedfirst analysis (5 gates)
- *1 Feature parity* zero
- *2 Performance* N/A
- *3 Stability* N/A
- *4 Capability* SDXL viável local
- *5 Critical
path readiness* bloqueia OG images dinâmicas (Hub package pages têm bug histórico 202604-29)
Open questions
- Q1: GPU dedicada vs compartilhar com runtime?
- Q2: kpkg para distribuir LoRAs/checkpoints?
Next steps
- Ratificar esta RFC (1 round de comments).
- Criar sector dir
services/ai/imaging/comkoder.toml,README.md, skeleton. - Abrir tickets de implementação em
services/ai/imaging/backlog/pending/. - Registrar em
meta/docs/stack/registries/self-hosted-pairs.mdse substituir externo.