Paradigmas
Paradigmas de IA/ML
Taxonomia conceitual do campo. Define os eixos que separam famílias de modelos e situa os LLMs modernos catalogados no resto do compendium.
1. Preditivo vs Generativo
Eixo definido pela *atureza da saída* É o corte mais visível para quem está fora do campo.
| Dimensão | IA Preditiva | IA Generativa |
|---|---|---|
| Pergunta | "Qual será o resultado?" | "Como seria um exemplo plausível?" |
| Saída | Rótulo, número, probabilidade | Artefato sintetizado (texto, imagem, áudio, código, molécula) |
| Espaço de saída | Pequeno e fechado | Enorme e aberto |
| Distribuição modelada | P(y|x) |
P(x) ou P(x|contexto) |
| Estocasticidade | Geralmente determinística | Estocástica por design |
| Métrica típica | Acurácia, AUC, RMSE | Perplexidade, FID, BLEU, avaliação humana |
| Modelos representativos | Regressão, XGBoost, ResNet (classificação), ARIMA | LLMs, difusão, GANs, VAEs |
| Aplicações | Scoring de crédito, fraude, churn, diagnóstico, demanda | Chat, código, imagem, voz, vídeo, design molecular |
*obreposição.*A fronteira não é absoluta: um LLM auto-regressivo também prediz (o próximo token). A diferença é que prediz iterativamente sobre um espaço de saída tão grande que o resultado emerge como criação. Sistemas reais combinam os dois — um RAG usa embeddings + classificação (preditivo) + geração; um copilot de fraude usa classificador + LLM que explica a decisão.
2. Discriminativo vs Generativo (formulação formal)
Eixo definido pela *istribuição de probabilidade modelada* É o corte usado em livros-texto (Bishop §1.5, Murphy cap. 1).
Modelos discriminativos
- Aprendem
P(y|x)diretamente — fronteira de decisão. - Não modelam como
xfoi gerado; só como separar classes. - Exemplos: regressão logística, SVM, CRF, redes neurais de classificação.
- Tendem a ter *enor erro assintótico*quando há dados suficientes (Ng & Jordan, NIPS 2001).
Modelos generativos
- Aprendem
P(x, y)ouP(x)— distribuição conjunta dos dados. - Permitem *mostragem*(gerar novos
x) além de classificar. - Exemplos: Naive Bayes, HMMs, VAEs, GANs, modelos de difusão, LLMs auto-regressivos.
- Convergem mais rápido em *egime de poucos dados* podem ser usados de forma não-supervisionada.
Relação com o eixo preditivo/generativo
Os dois eixos não são equivalentes:
- Modelo *iscriminativo*sempre é usado para predição.
- Modelo *enerativo formal*pode ser usado tanto para predição (via Bayes:
P(y|x) ∝ P(x|y)P(y)) quanto para síntese. - O que o público chama de "IA generativa" é a aplicação *intética*de modelos generativos formais — gerar
xnovos a partir deP(x|contexto).
3. Regime de supervisão
Eixo definido pelo *ipo de sinal de treino*
| Regime | Sinal | Exemplo |
|---|---|---|
| Supervisionado | Pares (x, y) rotulados por humano |
ImageNet, classificação de spam |
| Não-supervisionado | Apenas x |
Clustering, PCA, autoencoders |
| Auto-supervisionado | x particionado para gerar pseudo-rótulo de si mesmo |
Next-token prediction (LLMs), masked language modeling (BERT), contrastive (CLIP) |
| Semi-supervisionado | Pequeno conjunto rotulado + grande não-rotulado | FixMatch, pseudo-labeling |
| Reinforcement Learning | Recompensa escalar de ambiente/preferência | AlphaGo, RLHF, RLVR (DeepSeek-R1) |
Autosupervisão é o que permitiu a escala atual: a internet inteira vira dataset rotulado quando o rótulo é "o próximo token". Todo LLM moderno é treinado nesse regime, com *óstreino*sob SFT (supervisionado) + RLHF/RLVR (RL) para alinhamento.
Detalhes em 04-treinamento/pre-treino.md e 04-treinamento/pos-treino.md.
4. Outros eixos relevantes
- *aramétrico vs não
paramétrico*— o número de parâmetros é fixo (redes neurais, regressão) ou cresce com os dados (kNN, processos Gaussianos, kernel methods). - *requentista vs Bayesiano*— pontos estimados via MLE/MAP vs distribuição posterior completa sobre os parâmetros.
- *eterminístico vs estocástico*— saída idêntica para a mesma entrada vs amostragem (temperatura, top-p, ruído de difusão).
- *aixa
branca vs caixapreta*— interpretáveis por construção (árvores, GLMs) vs requerem ferramentas póshoc (SHAP, SAEs, circuit tracing — ver [`10segurancainterpretabilidade.md`](..10-seguranca/interpretabilidade.md)).
5. Onde os modelos do compendium se encaixam
| Família | Preditivo/Generativo | Discriminativo/Generativo (formal) | Regime de treino |
|---|---|---|---|
| LLMs auto-regressivos (GPT, Claude, Gemini, Llama, Qwen, DeepSeek) | Generativo | Generativo (P(x_t|x_<t)) |
Auto-supervisionado + RLHF/RLVR |
| LLMs encoder-only (BERT, RoBERTa) | Preditivo | Discriminativo (após fine-tune) | Auto-supervisionado (MLM) + supervisionado |
| Modelos de difusão (Stable Diffusion, FLUX, Sora) | Generativo | Generativo (score-based) | Auto-supervisionado (denoising) |
| GANs | Generativo | Generativo (implícito) | Adversarial |
| VAEs | Generativo | Generativo (latente) | Auto-supervisionado |
| Embeddings (CLIP, E5, BGE) | Preditivo (downstream) | Discriminativo (contrastivo) | Auto-supervisionado |
| AlphaFold, ESM | Preditivo (estrutura) e generativo (design) | Híbrido | Supervisionado + auto-supervisionado |
| Classificadores tabulares (XGBoost, LightGBM) | Preditivo | Discriminativo | Supervisionado |
| Modelos de RL (AlphaGo, agentes de jogos) | Política | — | Reinforcement learning |
6. Marcos da timeline por paradigma
Ancoragem cruzada com papers-fundacionais.md:
- *iscriminativo clássico:*Perceptron (1958) → Backprop (1986) → CNNs (1998) → AlexNet (2012) → ResNet (2015) → BERT (2018).
- *enerativo formal — visão:*RBMs (2006) → VAE (2013) → GAN (2014) → DDPM (2020) → Stable Diffusion (2022) → FLUX/Sora 2 (2024–2026).
- *enerativo formal — linguagem:*N
gramas → RNNs (1990s) → LSTM (1997) → Seq2Seq (2014) → Transformer (2017) → GPT234/5.x (2019–2025) → Claude Mythos (2026). - *einforcement learning:*TD
Gammon (1992) → DQN (2013) → AlphaGo (2016) → AlphaZero (2017) → RLHF (2022) → RLVR / DeepSeekR1 (2025).
A inflexão de 2017 (Transformer) + escala (Chinchilla 2022) + RL póstreino (RLHF 2022, RLVR 2025) é o que *undiu os eixos* o mesmo modelo generativo, treinado autosupervisionado, é usado simultaneamente para predição (classificação via prompting), geração (chat, código, imagem) e ação (agentes com tools).
Referências
- Ng, A. & Jordan, M. (2001). On Discriminative vs. Generative Classifiers: A comparison of logistic regression and naive Bayes. NIPS.
- Bishop, C. (2006). Pattern Recognition and Machine Learning, §1.5, §4.
- Murphy, K. (2022). Probabilistic Machine Learning, vol. 1, cap. 1 e 9. https:/robml.github.iopml-book
- Goodfellow, I. et al. (2016). Deep Learning, cap. 5 e 14. https:/ww.deeplearningbook.org/
- LeCun, Y. (2022). A Path Towards Autonomous Machine Intelligence — discute regimes de supervisão em escala.