Energia refrigeracao recursos

Energia, Refrigeração e Recursos Naturais em IA

Consumo de Energia no Treino

Estimativas de Grandes Modelos

Modelo Empresa Energia Estimada CO₂ Equivalente
GPT-3 (175B) OpenAI 1,287 MWh 552 toneladas
GPT-4 OpenAI ~50 GWh (estimado) ~25,000 toneladas
Llama 3 70B Meta ~530 MWh (treinamento) N/A
Llama 3 405B Meta ~7,700 MWh ~3,500 toneladas
DeepSeek-R1 DeepSeek ~6,000 MWh (estimado) ~2,700 toneladas
Grok-3 xAI ~500+ MWh N/A

*etodologia:*Energia = Potência_total × tempo × (1/eficiência)

  • H100: 700W × 1000 GPUs × 30 dias = 504 MWh apenas em GPU
  • Mais resfriamento, rede, armazenamento: multiplica por PUE (~1.3–1.5)

Consumo de Energia em Inferência

Por Token Gerado (estimativa)

Modelo Hardware Energia/token
GPT-4 H100 cluster ~0.001–0.003 Wh
Llama 3 8B RTX 4090 ~0.0002 Wh
Llama 3 70B 2× H100 ~0.0015 Wh

*hatGPT global:*Estimativas apontam para ~1 GWh/dia em 2024 (todas as queries)

IEA — Projeção Global de Energia para IA

Ano Consumo estimado Comparação
2023 180 TWh Suécia inteira
2025 485 TWh Reino Unido inteiro
2027 700 TWh Alemanha inteira
2030 *50 TWh* Japão inteiro

*onte:*IEA "Electricity 2024" report; confirmado por projeções de Goldman Sachs (700 TWh até 2030)


PUE — Power Usage Effectiveness

*órmula:*PUE = Energia total do data center / Energia dos servidores

  • PUE = 1.0 → perfeição (impossível)
  • PUE = 2.0 → metade da energia vai para resfriamento/outros (ruim)
  • Meta atual: PUE < 1.3
Empresa PUE Declarado (2024)
Google (cloud avg) 1.10
Microsoft Azure 1.12
Meta (AI DCs) 1.08
AWS 1.15
Data centers típicos 1.5–1.8

Sistemas de Refrigeração

Air Cooling (Resfriamento a Ar)

  • *adrão até 2023:*Servidores 1U/2U com dissipadores e ventiladores
  • *imite:*~400–500W por GPU (RTX 4090, A100 PCIe)
  • *usto:*Mais barato; sem risco de vazamento
  • *nadequado para:*H100 SXM (700W), B200 (1,000W), GB200 rack (120 kW)

Direct Liquid Cooling (DLC)

  • *ecanismo:*Tubos com água/glicol passam pelo heatsink do chip
  • *apacidade:*Dissipa até 1,000W por chip
  • *mplementação:*H100 SXM usa DLC; GB200 usa DLC obrigatório
  • *DU (Coolant Distribution Unit):*Módulo no rack que distribui o líquido
  • *emperatura alvo:*Coolant entrada < 35°C, saída < 50°C

Immersion Cooling (Resfriamento por Imersão)

*ingle-phase:*Servidores submersos em fluido dielétrico inerte (3M Novec ou similar)

  • Fluido não conduz eletricidade; GPU mergulhada diretamente
  • Dissipação: 100 kWm² vs 30 kWm² em ar
  • Custo: Alto inicial; manutenção complexa

*wo-phase:*Fluido evapora ao contato com chip → condensa no teto do tanque

  • Eficiência extrema; PUE < 1.05 possível
  • Uso: Pesquisa; clusters de alta densidade

Rear-Door Heat Exchangers (RDHx)

  • Trocador de calor na porta traseira do rack
  • Remove calor do ar quente antes de sair para a sala
  • Incremento sobre air cooling; sem mudanças no servidor
  • Eficaz para racks até 40 kW

Uso de Água

WUE — Water Usage Effectiveness

WUE = Volume de água evaporada / Energia dos servidores

  • Resfriamento a ar com torre de resfriamento evapora água
  • Data center de 100 MW pode evaporar 2–5 milhões de litros de água por dia
Empresa WUE (2024) Método
Google 0.96 L/kWh Reaproveitamento em áreas frias
Microsoft 0.3 L/kWh DLC closed-loop em novos DCs
Amazon 1.8 L/kWh Evaporação em torres

*mpacto local:*Preocupações em regiões com escassez hídrica (Arizona, Nevada, Holanda)


Fontes de Energia

Empresa Compromisso de Energia Renovável
Google 100% renovável desde 2017 (compra de créditos)
Microsoft 100% renovável até 2025 (contratos PPAs)
Meta 100% renovável; carbono negativo até 2030
Amazon/AWS 85% renovável em 2024; 100% meta 2025
xAI (Grok) Memphis, TN — mix coal/gas; controverso

*roblema:*"100% renovável" frequentemente significa créditos de carbono (RECs), não energia literal renovável 24/7.

*arbon Intensity por Região:*

  • França: 56 gCO₂/kWh (nuclear)
  • Islândia: 0 gCO₂kWh (geotérmicahidro)
  • EUA (média): 386 gCO₂/kWh
  • Polônia: 713 gCO₂/kWh (carvão)

Recursos Naturais — Minerais Críticos em GPUs

Materiais em uma GPU H100

Material Uso Origem Principal Risco
*obre* Interconexões, PCB Chile, Peru Baixo
*ilício* Chip base Areia de quartzo global Baixo
*ungstênio* Vias (TSV) China (85%), Rússia Alto
*obalto* Capacitores, bateria backup Congo DRC (70%) ALTO — conflito
*ítio* Baterias no DC Chile, Austrália Médio
*ântalo* Capacitores Congo DRC, Ruanda ALTO — conflito
*ndio* Telas, soldas China (60%) Médio
*álio* GaAs compounds China (95%) CRÍTICO (exportações restritas desde 2023)
*ermânio* Fibra ótica, chips China (60%) CRÍTICO (exportações restritas)
*eodímio* Magnetos (cooling fans) China (70%) Alto
*isprosio* Magnetos de alta temp China (monopolio) CRÍTICO
*érbio* Magnetos, lasers China (monopolio) CRÍTICO

Terras Raras (Rare Earth Elements — REEs)

  • 17 elementos (lantânio, cério, neodímio, etc.)
  • China controla ~60% da produção; ~85% do processamento
  • Uso: Magnetos permanentes (ventoinhas, motores), lasers, fosforescentes
  • China restringiu exportações em 2023 → impacto na cadeia de suprimentos

Conflito Mineral no Congo (DRC)

  • Congo: 70% do cobalto mundial, tântalo significativo
  • *inas artesanais (ASM):*20% da produção com trabalho infantil documentado
  • *ertificações:*RMI (Responsible Minerals Initiative), EICC
  • NVIDIA, AMD, Intel têm políticas de due diligence, mas rastreabilidade é difícil
  • *lternativas em pesquisa:*Baterias sem cobalto (LiFePO4); capacitores MLCC alternativos

Resíduos Eletrônicos (E-waste)

  • *ida útil de uma GPU de data center:*3–5 anos
  • *-waste global (2023):*53 milhões de toneladas métricas/ano
  • *eciclagem real:*Apenas ~17% é reciclado formalmente
  • *ressão:*Regulação EU WEEE (Waste Electrical and Electronic Equipment)
  • *niciativas:*Google recondicionamento; Dell Asset Recovery; AWS Refurb program

Sustentabilidade no Desenvolvimento de IA

Métricas de Eficiência

  • *LOPS/Watt:*Blackwell B200 ≈ 3× mais eficiente que H100 por FLOPS de inferência
  • *okens/Watt:*Inferência de Llama 3 8B em M2 Ultra ≈ 10× mais eficiente que H100 cloud
  • *ompute-optimal training:*Chinchilla (20 tokens/parâmetro) evita desperdício de compute

Modelos Menores com Mesma Qualidade

  • *hi-4 (14B):*Performance de modelos 70B em STEM — 5× menos energia
  • *wen2.5Coder7B:*Supera modelos 13B+ de 2023 — 2× menos energia por query
  • *istilação:*DeepSeekR17B tem 70% da capacidade do 70B — 10× menos energia

Green AI

  • *rtigo fundacional:*"Energy and Policy Considerations for Deep Learning in NLP" (Strubell et al., 2019)
  • *MCE (Marginal Carbon-aware Model Evaluation):*Benchmark levando em conta custo energético
  • *niciativa:*MLCommons Power Track; Energy Star para servidores de IA

Source: ../home/koder/dev/koder/meta/docs/ia/compendium/06-hardware/energia-refrigeracao-recursos.md