Energia refrigeracao recursos

Energia, Refrigeração e Recursos Naturais em IA

Consumo de Energia no Treino

Estimativas de Grandes Modelos

Modelo	Empresa	Energia Estimada	CO₂ Equivalente
GPT-3 (175B)	OpenAI	1,287 MWh	552 toneladas
GPT-4	OpenAI	~50 GWh (estimado)	~25,000 toneladas
Llama 3 70B	Meta	~530 MWh (treinamento)	N/A
Llama 3 405B	Meta	~7,700 MWh	~3,500 toneladas
DeepSeek-R1	DeepSeek	~6,000 MWh (estimado)	~2,700 toneladas
Grok-3	xAI	~500+ MWh	N/A

*etodologia:*Energia = Potência_total × tempo × (1/eficiência)

H100: 700W × 1000 GPUs × 30 dias = 504 MWh apenas em GPU
Mais resfriamento, rede, armazenamento: multiplica por PUE (~1.3–1.5)

Consumo de Energia em Inferência

Por Token Gerado (estimativa)

Modelo	Hardware	Energia/token
GPT-4	H100 cluster	~0.001–0.003 Wh
Llama 3 8B	RTX 4090	~0.0002 Wh
Llama 3 70B	2× H100	~0.0015 Wh

*hatGPT global:*Estimativas apontam para ~1 GWh/dia em 2024 (todas as queries)

IEA — Projeção Global de Energia para IA

Ano	Consumo estimado	Comparação
2023	180 TWh	Suécia inteira
2025	485 TWh	Reino Unido inteiro
2027	700 TWh	Alemanha inteira
2030	50 TWh	Japão inteiro

*onte:*IEA "Electricity 2024" report; confirmado por projeções de Goldman Sachs (700 TWh até 2030)

PUE — Power Usage Effectiveness

*órmula:*PUE = Energia total do data center / Energia dos servidores

PUE = 1.0 → perfeição (impossível)
PUE = 2.0 → metade da energia vai para resfriamento/outros (ruim)
Meta atual: PUE < 1.3

Empresa	PUE Declarado (2024)
Google (cloud avg)	1.10
Microsoft Azure	1.12
Meta (AI DCs)	1.08
AWS	1.15
Data centers típicos	1.5–1.8

Sistemas de Refrigeração

Air Cooling (Resfriamento a Ar)

*adrão até 2023:*Servidores 1U/2U com dissipadores e ventiladores
*imite:*~400–500W por GPU (RTX 4090, A100 PCIe)
*usto:*Mais barato; sem risco de vazamento
*nadequado para:*H100 SXM (700W), B200 (1,000W), GB200 rack (120 kW)

Direct Liquid Cooling (DLC)

*ecanismo:*Tubos com água/glicol passam pelo heatsink do chip
*apacidade:*Dissipa até 1,000W por chip
*mplementação:*H100 SXM usa DLC; GB200 usa DLC obrigatório
*DU (Coolant Distribution Unit):*Módulo no rack que distribui o líquido
*emperatura alvo:*Coolant entrada < 35°C, saída < 50°C

Immersion Cooling (Resfriamento por Imersão)

*ingle-phase:*Servidores submersos em fluido dielétrico inerte (3M Novec ou similar)

Fluido não conduz eletricidade; GPU mergulhada diretamente
Dissipação: 100 kWm² vs 30 kWm² em ar
Custo: Alto inicial; manutenção complexa

*wo-phase:*Fluido evapora ao contato com chip → condensa no teto do tanque

Eficiência extrema; PUE < 1.05 possível
Uso: Pesquisa; clusters de alta densidade

Rear-Door Heat Exchangers (RDHx)

Trocador de calor na porta traseira do rack
Remove calor do ar quente antes de sair para a sala
Incremento sobre air cooling; sem mudanças no servidor
Eficaz para racks até 40 kW

Uso de Água

WUE — Water Usage Effectiveness

WUE = Volume de água evaporada / Energia dos servidores

Resfriamento a ar com torre de resfriamento evapora água
Data center de 100 MW pode evaporar 2–5 milhões de litros de água por dia

Empresa	WUE (2024)	Método
Google	0.96 L/kWh	Reaproveitamento em áreas frias
Microsoft	0.3 L/kWh	DLC closed-loop em novos DCs
Amazon	1.8 L/kWh	Evaporação em torres

*mpacto local:*Preocupações em regiões com escassez hídrica (Arizona, Nevada, Holanda)

Fontes de Energia

Empresa	Compromisso de Energia Renovável
Google	100% renovável desde 2017 (compra de créditos)
Microsoft	100% renovável até 2025 (contratos PPAs)
Meta	100% renovável; carbono negativo até 2030
Amazon/AWS	85% renovável em 2024; 100% meta 2025
xAI (Grok)	Memphis, TN — mix coal/gas; controverso

*roblema:*"100% renovável" frequentemente significa créditos de carbono (RECs), não energia literal renovável 24/7.

*arbon Intensity por Região:*

França: 56 gCO₂/kWh (nuclear)
Islândia: 0 gCO₂kWh (geotérmicahidro)
EUA (média): 386 gCO₂/kWh
Polônia: 713 gCO₂/kWh (carvão)

Recursos Naturais — Minerais Críticos em GPUs

Materiais em uma GPU H100

Material	Uso	Origem Principal	Risco
obre	Interconexões, PCB	Chile, Peru	Baixo
ilício	Chip base	Areia de quartzo global	Baixo
ungstênio	Vias (TSV)	China (85%), Rússia	Alto
obalto	Capacitores, bateria backup	Congo DRC (70%)	ALTO — conflito
ítio	Baterias no DC	Chile, Austrália	Médio
ântalo	Capacitores	Congo DRC, Ruanda	ALTO — conflito
�ndio	Telas, soldas	China (60%)	Médio
álio	GaAs compounds	China (95%)	CRÍTICO (exportações restritas desde 2023)
ermânio	Fibra ótica, chips	China (60%)	CRÍTICO (exportações restritas)
eodímio	Magnetos (cooling fans)	China (70%)	Alto
isprosio	Magnetos de alta temp	China (monopolio)	CRÍTICO
érbio	Magnetos, lasers	China (monopolio)	CRÍTICO

Terras Raras (Rare Earth Elements — REEs)

17 elementos (lantânio, cério, neodímio, etc.)
China controla ~60% da produção; ~85% do processamento
Uso: Magnetos permanentes (ventoinhas, motores), lasers, fosforescentes
China restringiu exportações em 2023 → impacto na cadeia de suprimentos

Conflito Mineral no Congo (DRC)

Congo: 70% do cobalto mundial, tântalo significativo
*inas artesanais (ASM):*20% da produção com trabalho infantil documentado
*ertificações:*RMI (Responsible Minerals Initiative), EICC
NVIDIA, AMD, Intel têm políticas de due diligence, mas rastreabilidade é difícil
*lternativas em pesquisa:*Baterias sem cobalto (LiFePO4); capacitores MLCC alternativos

Resíduos Eletrônicos (E-waste)

*ida útil de uma GPU de data center:*3–5 anos
*-waste global (2023):*53 milhões de toneladas métricas/ano
*eciclagem real:*Apenas ~17% é reciclado formalmente
*ressão:*Regulação EU WEEE (Waste Electrical and Electronic Equipment)
*niciativas:*Google recondicionamento; Dell Asset Recovery; AWS Refurb program

Sustentabilidade no Desenvolvimento de IA

Métricas de Eficiência

*LOPS/Watt:*Blackwell B200 ≈ 3× mais eficiente que H100 por FLOPS de inferência
*okens/Watt:*Inferência de Llama 3 8B em M2 Ultra ≈ 10× mais eficiente que H100 cloud
*ompute-optimal training:*Chinchilla (20 tokens/parâmetro) evita desperdício de compute

Modelos Menores com Mesma Qualidade

*hi-4 (14B):*Performance de modelos 70B em STEM — 5× menos energia
*wen2.5~~Coder~~7B:*Supera modelos 13B+ de 2023 — 2× menos energia por query
*istilação:*DeepSeekR17B tem 70% da capacidade do 70B — 10× menos energia

Green AI

*rtigo fundacional:*"Energy and Policy Considerations for Deep Learning in NLP" (Strubell et al., 2019)
*MCE (Marginal Carbon-aware Model Evaluation):*Benchmark levando em conta custo energético
*niciativa:*MLCommons Power Track; Energy Star para servidores de IA