INDEX
AI Compendium — Koder
Base de conhecimento de referência para o desenvolvimento da IA da Koder (Kode). Compilada em abril de 2026. Atualizar conforme novos marcos surgirem.
Estrutura
| Diretório | Conteúdo |
|---|---|
01-fundamentos/ |
Paradigmas, livros, papers fundacionais, teoria (pré-Transformer) |
02-arquiteturas/ |
Transformer, atenção, MoE, SSMs, arquiteturas alternativas |
03-modelos/ |
Catálogo completo de famílias de LLMs (open-source e proprietários) |
04-treinamento/ |
Pré |
05-inferencia/ |
Quantização, speculative decoding, KV cache, servidores |
06-hardware/ |
GPUs NVIDIA/AMD, ASICs, memória HBM, interconexão, energia, refrigeração |
07-frameworks/ |
PyTorch/JAX, treino distribuído, fine-tuning, agentes, observabilidade |
08-benchmarks/ |
Benchmarks gerais, código, agentes, multimodal, ciências |
09-aplicacoes/ |
Vida, física, matemática, visão, áudio, vídeo, 3D, world models |
10-seguranca/ |
Alinhamento, interpretabilidade, red teaming, safety |
11-infraestrutura/ |
Cluster self-hosted, MLOps para modelos grandes, orquestração de GPUs |
Índice Completo de Arquivos
01-fundamentos
paradigmas.md— Preditivo vs generativo, discriminativo vs generativo formal, regimes de supervisão, mapa cruzado com a timelinelivros.md— Livros essenciais de ML/IA (Goodfellow, Bishop, Murphy, Sutton & Barto)papers-fundacionais.md— 60+ papers por era: 1943–2026
02-arquiteturas
transformer-e-atencao.md— Transformer, MQA, GQA, MLA, FlashAttention, RoPE, MoEarquiteturas-alternativas.md— SSMs (Mamba), xLSTM, RWKV, Liquid (LTCCfCLFM), JEPA, híbridosparadigmas-alternativos.md— Neurosimbólico (AlphaGeometry, DreamCoder, ∂ILP), Tsetlin Machines, HDCVSA, Forward-Forward, Predictive Coding, EBMHopfield Moderno, Active Inferencemultimodal.md— Flamingo, Chameleon, LLaVANeXT, treinamento crossmodal
03-modelos
open-source.md— Llama 4, Qwen3.x, DeepSeek V4, Mistral Small 4, Gemma 4, Phi-4, Kimi K2.6, Nemotron 3, OLMo Hybrid, Command Aproprietarios.md— GPT5.x, Claude Mythos, Gemini 3.1 Pro, Grok 4.3; SWEbench e Arena Elo
04-treinamento
pre-treino.md— Scaling laws, curadoria, paralelismo, ZeRO, FSDPpos-treino.md— SFT, DPO, GRPO, RLVR, PRMs, test-time computedatasets.md— FineWeb, RedPajama, The Stack, MATH, UltraChat e maisdados-sinteticos.md— Self-Instruct, Alpaca, Orca, Phi Textbooks, MetaMathdata-pipeline.md— Crawler, dedup (MinHash/SimHash), filtros de qualidade, PII scrubbingeconomia.md— Custo por escala (7B30B70B), build vs fine-tune vs API, roadmap
05-inferencia
quantizacao.md— GPTQ, AWQ, GGUF, BitsAndBytes, TurboQuant, BitNet, NVFP4speculative-decoding.md— EAGLE123, PEAGLE, Medusa, Lookahead, MTP, QuantSpeckv-cache.md— PagedAttention, RadixAttention, H2O, SnapKV, MLA, TurboQuantservidores.md— vLLM, SGLang, TGI, llama.cpp, Ollama, TensorRTLLM, MLCLLM
06-hardware
gpus-nvidia.md— A100, H100, H200, B100B200B300, GB200 NVL72, RTX 4090/5090gpus-outros-asics.md— AMD MI300XMI355XMI450, Google TPU v4–v7 IronwoodTPU 8t8i, AWS Trainium3, Intel Gaudi, Groq, Cerebrascpu-x86-extensions.md— AVX-512 VNNI, AMX, AVX10, ACE (white paper AMD+Intel, abr/2026), x86 Ecosystem Advisory Groupmemoria-interconexao.md— HBM 1–4e, GDDR7, NVLink, NVSwitch, InfiniBand, PCIe, CXLneuromorfico.md— Intel Loihi 2, IBM NorthPole, SpiNNaker 2, BrainScaleS2, Innatera/SynSense; SNN training (surrogate gradients, ANNSNN, STBP); snnTorchNorseLavaenergia-refrigeracao-recursos.md— Consumo de energia, PUE, WUE, minerais críticos, sustentabilidade
07-frameworks
treinamento-distribuido.md— PyTorch, JAX, DeepSpeed, FSDP, Megatron-LM, ColossalAIfine-tuning.md— PEFT, LoRA, QLoRA, TRL, Axolotl, LLaMA-Factory, Unslothinferencia-local.md— Setup local: Ollama, llama.cpp, vLLM, integração com editoresagentes.md— LangChain, LangGraph, DSPy, smolagents, Pydantic AI, Strands, OpenAI Agents SDK, Claude Agent SDKprotocolos.md— MCP, A2A, ACP, AGNTCY, NLIP, OpenAI-compat, Bedrock Converse, Computer Use, AP2, x402, OTel GenAI semconv, OASFobservabilidade.md— LangFuse, Phoenix, W&B, MLflow, métricas de produção, OTEL
08-benchmarks
gerais-raciocinio.md— MMLU, ARC, GSM8K, MATH, AIME, Humanity's Last Exam, GPQA, ARCAGI2codigo.md— HumanEval, SWE-bench Verified, LiveCodeBench, BigCodeBench, RepoBenchagentes-long-context.md— GAIA, τbench, WebArena, OSWorld, RULER, HELMET, NIAH, GDPval, SWEBench Pro, Agent-SafetyBenchmultimodal-ciencias.md— MMMU, DocVQA, MedQA, LegalBench, Video-MME, ChatBot Arenaavaliacao-continua.md— Eval loop privado, LLMasa-judge, canary strings, contaminação, drift
09-aplicacoes
ciencias-vida.md— AlphaFold 23, ESM-123, Evo 12, GNoME, drug discoveryciencias-fisicas-matematica.md— GraphCast, AlphaProof, FermiNet, plasma fusion, quantum MLvisao-imagem.md— ViT, CLIP, SAM 1/2, Stable Diffusion, FLUX.1, DALL-E 3, VLMsaudio-fala.md— Whisper, Moshi, F5TTS, EnCodec, MusicGen, GPT4o Realtimevideo-3d-world-models.md— Sora 2, Veo 3, HunyuanVideo, NeRF, Gaussian Splatting, DreamerV3, Genie 2, Cosmos
10-seguranca
interpretabilidade.md— SAEs, circuits, features, Gemma Scope, TransformerLens, MIT 2026, vetores de emoção em Claudealinhamento.md— Constitutional AI, RLHF, Constitutional Classifiers, red teaming, jailbreaks, HarmBench, EU AI Act (full applicability ago/2026)
11-infraestrutura
cluster-self-hosted.md— KubernetesSlurm, InfiniBandRoCEv2, storage distribuído (LustreCephWekaIO)mlops-modelos-grandes.md— Versionamento de modelos, canary deploy, monitoring de drift, rate limiting
Entradas rápidas — os mais importantes
Papers incontornáveis
- *ttention Is All You Need*(2017) — arXiv:1706.03762 — base de tudo
- *caling Laws*(Kaplan 2020) — arXiv:2001.08361
- *hinchilla*(Hoffmann 2022) — arXiv:2203.15556 — ótimo de compute
- *eepSeek-R1*(2025) — arXiv:2501.12948 — RLVR em larga escala
- *urboQuant*(Google/ICLR 2026) — arXiv:2504.19874 — compactação KV cache 6×
Modelos abertos prioritários para Kode
- *wen2.5
Coder32B*— melhor relação tamanho/performance para código - *eepSeek-V3/R1*— raciocínio de fronteira, MIT license
- *lama 4 Scout*— 10M context; MoE nativo multimodal; Llama License
- *imi K2.6*— SWE-Bench Pro líder open; 256K; agentic coding
- *emma 4 31B*— melhor open por parâmetro; Apache 2.0; multimodal
Stack de desenvolvimento do Kode
- *ine-tuning:*Axolotl + TRL + Unsloth
- *nferência:*vLLM (produção) + SGLang (alternativa)
- *val:*lm
evaluationharness + SWE-bench runner - *bservabilidade:*Weights & Biases + LangFuse
Última atualização: 20260522 (adicionados paradigmasalternativos.md + neuromorfico.md + protocolos.md; expandido arquiteturasalternativas.md com Liquid NN e JEPA; Camada D acrescentada ao /k-ia-compendium para manter linhas de pesquisa alternativas atualizadas; split de protocolos do compendium em arquivo dedicado)