Paradigmas

Paradigmas de IA/ML

Taxonomia conceitual do campo. Define os eixos que separam famílias de modelos e situa os LLMs modernos catalogados no resto do compendium.

1. Preditivo vs Generativo

Eixo definido pela *atureza da saída* É o corte mais visível para quem está fora do campo.

Dimensão	IA Preditiva	IA Generativa
Pergunta	"Qual será o resultado?"	"Como seria um exemplo plausível?"
Saída	Rótulo, número, probabilidade	Artefato sintetizado (texto, imagem, áudio, código, molécula)
Espaço de saída	Pequeno e fechado	Enorme e aberto
Distribuição modelada	`P(y\|x)`	`P(x)` ou `P(x\|contexto)`
Estocasticidade	Geralmente determinística	Estocástica por design
Métrica típica	Acurácia, AUC, RMSE	Perplexidade, FID, BLEU, avaliação humana
Modelos representativos	Regressão, XGBoost, ResNet (classificação), ARIMA	LLMs, difusão, GANs, VAEs
Aplicações	Scoring de crédito, fraude, churn, diagnóstico, demanda	Chat, código, imagem, voz, vídeo, design molecular

*obreposição.*A fronteira não é absoluta: um LLM auto-regressivo também prediz (o próximo token). A diferença é que prediz iterativamente sobre um espaço de saída tão grande que o resultado emerge como criação. Sistemas reais combinam os dois — um RAG usa embeddings + classificação (preditivo) + geração; um copilot de fraude usa classificador + LLM que explica a decisão.

2. Discriminativo vs Generativo (formulação formal)

Eixo definido pela *istribuição de probabilidade modelada* É o corte usado em livros-texto (Bishop §1.5, Murphy cap. 1).

Modelos discriminativos

Aprendem P(y|x) diretamente — fronteira de decisão.
Não modelam como x foi gerado; só como separar classes.
Exemplos: regressão logística, SVM, CRF, redes neurais de classificação.
Tendem a ter *enor erro assintótico*quando há dados suficientes (Ng & Jordan, NIPS 2001).

Modelos generativos

Aprendem P(x, y) ou P(x) — distribuição conjunta dos dados.
Permitem *mostragem*(gerar novos x) além de classificar.
Exemplos: Naive Bayes, HMMs, VAEs, GANs, modelos de difusão, LLMs auto-regressivos.
Convergem mais rápido em *egime de poucos dados* podem ser usados de forma não-supervisionada.

Relação com o eixo preditivo/generativo

Os dois eixos não são equivalentes:

Modelo *iscriminativo*sempre é usado para predição.
Modelo *enerativo formal*pode ser usado tanto para predição (via Bayes: P(y|x) ∝ P(x|y)P(y)) quanto para síntese.
O que o público chama de "IA generativa" é a aplicação *intética*de modelos generativos formais — gerar x novos a partir de P(x|contexto).

3. Regime de supervisão

Eixo definido pelo *ipo de sinal de treino*

Regime	Sinal	Exemplo
Supervisionado	Pares `(x, y)` rotulados por humano	ImageNet, classificação de spam
Não-supervisionado	Apenas `x`	Clustering, PCA, autoencoders
Auto-supervisionado	`x` particionado para gerar pseudo-rótulo de si mesmo	Next-token prediction (LLMs), masked language modeling (BERT), contrastive (CLIP)
Semi-supervisionado	Pequeno conjunto rotulado + grande não-rotulado	FixMatch, pseudo-labeling
Reinforcement Learning	Recompensa escalar de ambiente/preferência	AlphaGo, RLHF, RLVR (DeepSeek-R1)

Auto~~supervisão é o que permitiu a escala atual: a internet inteira vira dataset rotulado quando o rótulo é "o próximo token". Todo LLM moderno é treinado nesse regime, com *ós~~treino*sob SFT (supervisionado) + RLHF/RLVR (RL) para alinhamento.

Detalhes em 04-treinamento/pre-treino.md e 04-treinamento/pos-treino.md.

4. Outros eixos relevantes

*aramétrico vs não~~paramétrico*— o número de parâmetros é fixo (redes neurais, regressão) ou cresce com os dados (k~~NN, processos Gaussianos, kernel methods).
*requentista vs Bayesiano*— pontos estimados via MLE/MAP vs distribuição posterior completa sobre os parâmetros.
*eterminístico vs estocástico*— saída idêntica para a mesma entrada vs amostragem (temperatura, top-p, ruído de difusão).
*aixa~~branca vs caixa~~preta*— interpretáveis por construção (árvores, GLMs) vs requerem ferramentas pós~~hoc (SHAP, SAEs, circuit tracing — ver [`10~~segurancainterpretabilidade.md`](..10-seguranca/interpretabilidade.md)).

5. Onde os modelos do compendium se encaixam

Família	Preditivo/Generativo	Discriminativo/Generativo (formal)	Regime de treino
LLMs auto-regressivos (GPT, Claude, Gemini, Llama, Qwen, DeepSeek)	Generativo	Generativo (`P(x_t\|x_<t)`)	Auto-supervisionado + RLHF/RLVR
LLMs encoder-only (BERT, RoBERTa)	Preditivo	Discriminativo (após fine-tune)	Auto-supervisionado (MLM) + supervisionado
Modelos de difusão (Stable Diffusion, FLUX, Sora)	Generativo	Generativo (score-based)	Auto-supervisionado (denoising)
GANs	Generativo	Generativo (implícito)	Adversarial
VAEs	Generativo	Generativo (latente)	Auto-supervisionado
Embeddings (CLIP, E5, BGE)	Preditivo (downstream)	Discriminativo (contrastivo)	Auto-supervisionado
AlphaFold, ESM	Preditivo (estrutura) e generativo (design)	Híbrido	Supervisionado + auto-supervisionado
Classificadores tabulares (XGBoost, LightGBM)	Preditivo	Discriminativo	Supervisionado
Modelos de RL (AlphaGo, agentes de jogos)	Política	—	Reinforcement learning

6. Marcos da timeline por paradigma

Ancoragem cruzada com papers-fundacionais.md:

*iscriminativo clássico:*Perceptron (1958) → Backprop (1986) → CNNs (1998) → AlexNet (2012) → ResNet (2015) → BERT (2018).
*enerativo formal — visão:*RBMs (2006) → VAE (2013) → GAN (2014) → DDPM (2020) → Stable Diffusion (2022) → FLUX/Sora 2 (2024–2026).
*enerativo formal — linguagem:*N~~gramas → RNNs (1990s) → LSTM (1997) → Seq2Seq (2014) → Transformer (2017) → GPT~~234/5.x (2019–2025) → Claude Mythos (2026).
*einforcement learning:*TD~~Gammon (1992) → DQN (2013) → AlphaGo (2016) → AlphaZero (2017) → RLHF (2022) → RLVR / DeepSeek~~R1 (2025).

A inflexão de 2017 (Transformer) + escala (Chinchilla 2022) + RL pós~~treino (RLHF 2022, RLVR 2025) é o que *undiu os eixos* o mesmo modelo generativo, treinado auto~~supervisionado, é usado simultaneamente para predição (classificação via prompting), geração (chat, código, imagem) e ação (agentes com tools).

Referências

Ng, A. & Jordan, M. (2001). On Discriminative vs. Generative Classifiers: A comparison of logistic regression and naive Bayes. NIPS.
Bishop, C. (2006). Pattern Recognition and Machine Learning, §1.5, §4.
Murphy, K. (2022). Probabilistic Machine Learning, vol. 1, cap. 1 e 9. https:/robml.github.iopml-book
Goodfellow, I. et al. (2016). Deep Learning, cap. 5 e 14. https:/ww.deeplearningbook.org/
LeCun, Y. (2022). A Path Towards Autonomous Machine Intelligence — discute regimes de supervisão em escala.