Paradigmas

Paradigmas de IA/ML

Taxonomia conceitual do campo. Define os eixos que separam famílias de modelos e situa os LLMs modernos catalogados no resto do compendium.


1. Preditivo vs Generativo

Eixo definido pela *atureza da saída* É o corte mais visível para quem está fora do campo.

Dimensão IA Preditiva IA Generativa
Pergunta "Qual será o resultado?" "Como seria um exemplo plausível?"
Saída Rótulo, número, probabilidade Artefato sintetizado (texto, imagem, áudio, código, molécula)
Espaço de saída Pequeno e fechado Enorme e aberto
Distribuição modelada P(y|x) P(x) ou P(x|contexto)
Estocasticidade Geralmente determinística Estocástica por design
Métrica típica Acurácia, AUC, RMSE Perplexidade, FID, BLEU, avaliação humana
Modelos representativos Regressão, XGBoost, ResNet (classificação), ARIMA LLMs, difusão, GANs, VAEs
Aplicações Scoring de crédito, fraude, churn, diagnóstico, demanda Chat, código, imagem, voz, vídeo, design molecular

*obreposição.*A fronteira não é absoluta: um LLM auto-regressivo também prediz (o próximo token). A diferença é que prediz iterativamente sobre um espaço de saída tão grande que o resultado emerge como criação. Sistemas reais combinam os dois — um RAG usa embeddings + classificação (preditivo) + geração; um copilot de fraude usa classificador + LLM que explica a decisão.


2. Discriminativo vs Generativo (formulação formal)

Eixo definido pela *istribuição de probabilidade modelada* É o corte usado em livros-texto (Bishop §1.5, Murphy cap. 1).

Modelos discriminativos

  • Aprendem P(y|x) diretamente — fronteira de decisão.
  • Não modelam como x foi gerado; só como separar classes.
  • Exemplos: regressão logística, SVM, CRF, redes neurais de classificação.
  • Tendem a ter *enor erro assintótico*quando há dados suficientes (Ng & Jordan, NIPS 2001).

Modelos generativos

  • Aprendem P(x, y) ou P(x) — distribuição conjunta dos dados.
  • Permitem *mostragem*(gerar novos x) além de classificar.
  • Exemplos: Naive Bayes, HMMs, VAEs, GANs, modelos de difusão, LLMs auto-regressivos.
  • Convergem mais rápido em *egime de poucos dados* podem ser usados de forma não-supervisionada.

Relação com o eixo preditivo/generativo

Os dois eixos não são equivalentes:

  • Modelo *iscriminativo*sempre é usado para predição.
  • Modelo *enerativo formal*pode ser usado tanto para predição (via Bayes: P(y|x) ∝ P(x|y)P(y)) quanto para síntese.
  • O que o público chama de "IA generativa" é a aplicação *intética*de modelos generativos formais — gerar x novos a partir de P(x|contexto).

3. Regime de supervisão

Eixo definido pelo *ipo de sinal de treino*

Regime Sinal Exemplo
Supervisionado Pares (x, y) rotulados por humano ImageNet, classificação de spam
Não-supervisionado Apenas x Clustering, PCA, autoencoders
Auto-supervisionado x particionado para gerar pseudo-rótulo de si mesmo Next-token prediction (LLMs), masked language modeling (BERT), contrastive (CLIP)
Semi-supervisionado Pequeno conjunto rotulado + grande não-rotulado FixMatch, pseudo-labeling
Reinforcement Learning Recompensa escalar de ambiente/preferência AlphaGo, RLHF, RLVR (DeepSeek-R1)

Autosupervisão é o que permitiu a escala atual: a internet inteira vira dataset rotulado quando o rótulo é "o próximo token". Todo LLM moderno é treinado nesse regime, com *óstreino*sob SFT (supervisionado) + RLHF/RLVR (RL) para alinhamento.

Detalhes em 04-treinamento/pre-treino.md e 04-treinamento/pos-treino.md.


4. Outros eixos relevantes

  • *aramétrico vs nãoparamétrico*— o número de parâmetros é fixo (redes neurais, regressão) ou cresce com os dados (kNN, processos Gaussianos, kernel methods).
  • *requentista vs Bayesiano*— pontos estimados via MLE/MAP vs distribuição posterior completa sobre os parâmetros.
  • *eterminístico vs estocástico*— saída idêntica para a mesma entrada vs amostragem (temperatura, top-p, ruído de difusão).
  • *aixabranca vs caixapreta*— interpretáveis por construção (árvores, GLMs) vs requerem ferramentas póshoc (SHAP, SAEs, circuit tracing — ver [`10segurancainterpretabilidade.md`](..10-seguranca/interpretabilidade.md)).

5. Onde os modelos do compendium se encaixam

Família Preditivo/Generativo Discriminativo/Generativo (formal) Regime de treino
LLMs auto-regressivos (GPT, Claude, Gemini, Llama, Qwen, DeepSeek) Generativo Generativo (P(x_t|x_<t)) Auto-supervisionado + RLHF/RLVR
LLMs encoder-only (BERT, RoBERTa) Preditivo Discriminativo (após fine-tune) Auto-supervisionado (MLM) + supervisionado
Modelos de difusão (Stable Diffusion, FLUX, Sora) Generativo Generativo (score-based) Auto-supervisionado (denoising)
GANs Generativo Generativo (implícito) Adversarial
VAEs Generativo Generativo (latente) Auto-supervisionado
Embeddings (CLIP, E5, BGE) Preditivo (downstream) Discriminativo (contrastivo) Auto-supervisionado
AlphaFold, ESM Preditivo (estrutura) e generativo (design) Híbrido Supervisionado + auto-supervisionado
Classificadores tabulares (XGBoost, LightGBM) Preditivo Discriminativo Supervisionado
Modelos de RL (AlphaGo, agentes de jogos) Política Reinforcement learning

6. Marcos da timeline por paradigma

Ancoragem cruzada com papers-fundacionais.md:

  • *iscriminativo clássico:*Perceptron (1958) → Backprop (1986) → CNNs (1998) → AlexNet (2012) → ResNet (2015) → BERT (2018).
  • *enerativo formal — visão:*RBMs (2006) → VAE (2013) → GAN (2014) → DDPM (2020) → Stable Diffusion (2022) → FLUX/Sora 2 (2024–2026).
  • *enerativo formal — linguagem:*Ngramas → RNNs (1990s) → LSTM (1997) → Seq2Seq (2014) → Transformer (2017) → GPT234/5.x (2019–2025) → Claude Mythos (2026).
  • *einforcement learning:*TDGammon (1992) → DQN (2013) → AlphaGo (2016) → AlphaZero (2017) → RLHF (2022) → RLVR / DeepSeekR1 (2025).

A inflexão de 2017 (Transformer) + escala (Chinchilla 2022) + RL póstreino (RLHF 2022, RLVR 2025) é o que *undiu os eixos* o mesmo modelo generativo, treinado autosupervisionado, é usado simultaneamente para predição (classificação via prompting), geração (chat, código, imagem) e ação (agentes com tools).


Referências

  • Ng, A. & Jordan, M. (2001). On Discriminative vs. Generative Classifiers: A comparison of logistic regression and naive Bayes. NIPS.
  • Bishop, C. (2006). Pattern Recognition and Machine Learning, §1.5, §4.
  • Murphy, K. (2022). Probabilistic Machine Learning, vol. 1, cap. 1 e 9. https:/robml.github.iopml-book
  • Goodfellow, I. et al. (2016). Deep Learning, cap. 5 e 14. https:/ww.deeplearningbook.org/
  • LeCun, Y. (2022). A Path Towards Autonomous Machine Intelligence — discute regimes de supervisão em escala.

Source: ../home/koder/dev/koder/meta/docs/ia/compendium/01-fundamentos/paradigmas.md