INDEX

AI Compendium — Koder

Base de conhecimento de referência para o desenvolvimento da IA da Koder (Kode). Compilada em abril de 2026. Atualizar conforme novos marcos surgirem.


Estrutura

Diretório Conteúdo
01-fundamentos/ Paradigmas, livros, papers fundacionais, teoria (pré-Transformer)
02-arquiteturas/ Transformer, atenção, MoE, SSMs, arquiteturas alternativas
03-modelos/ Catálogo completo de famílias de LLMs (open-source e proprietários)
04-treinamento/ Prétreino, póstreino (SFTDPORLVR), datasets, dados sintéticos
05-inferencia/ Quantização, speculative decoding, KV cache, servidores
06-hardware/ GPUs NVIDIA/AMD, ASICs, memória HBM, interconexão, energia, refrigeração
07-frameworks/ PyTorch/JAX, treino distribuído, fine-tuning, agentes, observabilidade
08-benchmarks/ Benchmarks gerais, código, agentes, multimodal, ciências
09-aplicacoes/ Vida, física, matemática, visão, áudio, vídeo, 3D, world models
10-seguranca/ Alinhamento, interpretabilidade, red teaming, safety
11-infraestrutura/ Cluster self-hosted, MLOps para modelos grandes, orquestração de GPUs

Índice Completo de Arquivos

01-fundamentos

  • paradigmas.md — Preditivo vs generativo, discriminativo vs generativo formal, regimes de supervisão, mapa cruzado com a timeline
  • livros.md — Livros essenciais de ML/IA (Goodfellow, Bishop, Murphy, Sutton & Barto)
  • papers-fundacionais.md — 60+ papers por era: 1943–2026

02-arquiteturas

03-modelos

  • open-source.md — Llama 4, Qwen3.x, DeepSeek V4, Mistral Small 4, Gemma 4, Phi-4, Kimi K2.6, Nemotron 3, OLMo Hybrid, Command A
  • proprietarios.md — GPT5.x, Claude Mythos, Gemini 3.1 Pro, Grok 4.3; SWEbench e Arena Elo

04-treinamento

  • pre-treino.md — Scaling laws, curadoria, paralelismo, ZeRO, FSDP
  • pos-treino.md — SFT, DPO, GRPO, RLVR, PRMs, test-time compute
  • datasets.md — FineWeb, RedPajama, The Stack, MATH, UltraChat e mais
  • dados-sinteticos.md — Self-Instruct, Alpaca, Orca, Phi Textbooks, MetaMath
  • data-pipeline.md — Crawler, dedup (MinHash/SimHash), filtros de qualidade, PII scrubbing
  • economia.md — Custo por escala (7B30B70B), build vs fine-tune vs API, roadmap

05-inferencia

  • quantizacao.md — GPTQ, AWQ, GGUF, BitsAndBytes, TurboQuant, BitNet, NVFP4
  • speculative-decoding.md — EAGLE123, PEAGLE, Medusa, Lookahead, MTP, QuantSpec
  • kv-cache.md — PagedAttention, RadixAttention, H2O, SnapKV, MLA, TurboQuant
  • servidores.md — vLLM, SGLang, TGI, llama.cpp, Ollama, TensorRTLLM, MLCLLM

06-hardware

  • gpus-nvidia.md — A100, H100, H200, B100B200B300, GB200 NVL72, RTX 4090/5090
  • gpus-outros-asics.md — AMD MI300XMI355XMI450, Google TPU v4–v7 IronwoodTPU 8t8i, AWS Trainium3, Intel Gaudi, Groq, Cerebras
  • cpu-x86-extensions.md — AVX-512 VNNI, AMX, AVX10, ACE (white paper AMD+Intel, abr/2026), x86 Ecosystem Advisory Group
  • memoria-interconexao.md — HBM 1–4e, GDDR7, NVLink, NVSwitch, InfiniBand, PCIe, CXL
  • neuromorfico.md — Intel Loihi 2, IBM NorthPole, SpiNNaker 2, BrainScaleS2, Innatera/SynSense; SNN training (surrogate gradients, ANNSNN, STBP); snnTorchNorseLava
  • energia-refrigeracao-recursos.md — Consumo de energia, PUE, WUE, minerais críticos, sustentabilidade

07-frameworks

  • treinamento-distribuido.md — PyTorch, JAX, DeepSpeed, FSDP, Megatron-LM, ColossalAI
  • fine-tuning.md — PEFT, LoRA, QLoRA, TRL, Axolotl, LLaMA-Factory, Unsloth
  • inferencia-local.md — Setup local: Ollama, llama.cpp, vLLM, integração com editores
  • agentes.md — LangChain, LangGraph, DSPy, smolagents, Pydantic AI, Strands, OpenAI Agents SDK, Claude Agent SDK
  • protocolos.md — MCP, A2A, ACP, AGNTCY, NLIP, OpenAI-compat, Bedrock Converse, Computer Use, AP2, x402, OTel GenAI semconv, OASF
  • observabilidade.md — LangFuse, Phoenix, W&B, MLflow, métricas de produção, OTEL

08-benchmarks

  • gerais-raciocinio.md — MMLU, ARC, GSM8K, MATH, AIME, Humanity's Last Exam, GPQA, ARCAGI2
  • codigo.md — HumanEval, SWE-bench Verified, LiveCodeBench, BigCodeBench, RepoBench
  • agentes-long-context.md — GAIA, τbench, WebArena, OSWorld, RULER, HELMET, NIAH, GDPval, SWEBench Pro, Agent-SafetyBench
  • multimodal-ciencias.md — MMMU, DocVQA, MedQA, LegalBench, Video-MME, ChatBot Arena
  • avaliacao-continua.md — Eval loop privado, LLMasa-judge, canary strings, contaminação, drift

09-aplicacoes

10-seguranca

  • interpretabilidade.md — SAEs, circuits, features, Gemma Scope, TransformerLens, MIT 2026, vetores de emoção em Claude
  • alinhamento.md — Constitutional AI, RLHF, Constitutional Classifiers, red teaming, jailbreaks, HarmBench, EU AI Act (full applicability ago/2026)

11-infraestrutura


Entradas rápidas — os mais importantes

Papers incontornáveis

  • *ttention Is All You Need*(2017) — arXiv:1706.03762 — base de tudo
  • *caling Laws*(Kaplan 2020) — arXiv:2001.08361
  • *hinchilla*(Hoffmann 2022) — arXiv:2203.15556 — ótimo de compute
  • *eepSeek-R1*(2025) — arXiv:2501.12948 — RLVR em larga escala
  • *urboQuant*(Google/ICLR 2026) — arXiv:2504.19874 — compactação KV cache 6×

Modelos abertos prioritários para Kode

  • *wen2.5Coder32B*— melhor relação tamanho/performance para código
  • *eepSeek-V3/R1*— raciocínio de fronteira, MIT license
  • *lama 4 Scout*— 10M context; MoE nativo multimodal; Llama License
  • *imi K2.6*— SWE-Bench Pro líder open; 256K; agentic coding
  • *emma 4 31B*— melhor open por parâmetro; Apache 2.0; multimodal

Stack de desenvolvimento do Kode

  • *ine-tuning:*Axolotl + TRL + Unsloth
  • *nferência:*vLLM (produção) + SGLang (alternativa)
  • *val:*lmevaluationharness + SWE-bench runner
  • *bservabilidade:*Weights & Biases + LangFuse

Última atualização: 20260522 (adicionados paradigmasalternativos.md + neuromorfico.md + protocolos.md; expandido arquiteturasalternativas.md com Liquid NN e JEPA; Camada D acrescentada ao /k-ia-compendium para manter linhas de pesquisa alternativas atualizadas; split de protocolos do compendium em arquivo dedicado)

Source: ../home/koder/dev/koder/meta/docs/ia/compendium/INDEX.md