Energia refrigeracao recursos
Energia, Refrigeração e Recursos Naturais em IA
Consumo de Energia no Treino
Estimativas de Grandes Modelos
| Modelo | Empresa | Energia Estimada | CO₂ Equivalente |
|---|---|---|---|
| GPT-3 (175B) | OpenAI | 1,287 MWh | 552 toneladas |
| GPT-4 | OpenAI | ~50 GWh (estimado) | ~25,000 toneladas |
| Llama 3 70B | Meta | ~530 MWh (treinamento) | N/A |
| Llama 3 405B | Meta | ~7,700 MWh | ~3,500 toneladas |
| DeepSeek-R1 | DeepSeek | ~6,000 MWh (estimado) | ~2,700 toneladas |
| Grok-3 | xAI | ~500+ MWh | N/A |
*etodologia:*Energia = Potência_total × tempo × (1/eficiência)
- H100: 700W × 1000 GPUs × 30 dias = 504 MWh apenas em GPU
- Mais resfriamento, rede, armazenamento: multiplica por PUE (~1.3–1.5)
Consumo de Energia em Inferência
Por Token Gerado (estimativa)
| Modelo | Hardware | Energia/token |
|---|---|---|
| GPT-4 | H100 cluster | ~0.001–0.003 Wh |
| Llama 3 8B | RTX 4090 | ~0.0002 Wh |
| Llama 3 70B | 2× H100 | ~0.0015 Wh |
*hatGPT global:*Estimativas apontam para ~1 GWh/dia em 2024 (todas as queries)
IEA — Projeção Global de Energia para IA
| Ano | Consumo estimado | Comparação |
|---|---|---|
| 2023 | 180 TWh | Suécia inteira |
| 2025 | 485 TWh | Reino Unido inteiro |
| 2027 | 700 TWh | Alemanha inteira |
| 2030 | *50 TWh* | Japão inteiro |
*onte:*IEA "Electricity 2024" report; confirmado por projeções de Goldman Sachs (700 TWh até 2030)
PUE — Power Usage Effectiveness
*órmula:*PUE = Energia total do data center / Energia dos servidores
- PUE = 1.0 → perfeição (impossível)
- PUE = 2.0 → metade da energia vai para resfriamento/outros (ruim)
- Meta atual: PUE < 1.3
| Empresa | PUE Declarado (2024) |
|---|---|
| Google (cloud avg) | 1.10 |
| Microsoft Azure | 1.12 |
| Meta (AI DCs) | 1.08 |
| AWS | 1.15 |
| Data centers típicos | 1.5–1.8 |
Sistemas de Refrigeração
Air Cooling (Resfriamento a Ar)
- *adrão até 2023:*Servidores 1U/2U com dissipadores e ventiladores
- *imite:*~400–500W por GPU (RTX 4090, A100 PCIe)
- *usto:*Mais barato; sem risco de vazamento
- *nadequado para:*H100 SXM (700W), B200 (1,000W), GB200 rack (120 kW)
Direct Liquid Cooling (DLC)
- *ecanismo:*Tubos com água/glicol passam pelo heatsink do chip
- *apacidade:*Dissipa até 1,000W por chip
- *mplementação:*H100 SXM usa DLC; GB200 usa DLC obrigatório
- *DU (Coolant Distribution Unit):*Módulo no rack que distribui o líquido
- *emperatura alvo:*Coolant entrada < 35°C, saída < 50°C
Immersion Cooling (Resfriamento por Imersão)
*ingle-phase:*Servidores submersos em fluido dielétrico inerte (3M Novec ou similar)
- Fluido não conduz eletricidade; GPU mergulhada diretamente
- Dissipação: 100 kWm² vs 30 kWm² em ar
- Custo: Alto inicial; manutenção complexa
*wo-phase:*Fluido evapora ao contato com chip → condensa no teto do tanque
- Eficiência extrema; PUE < 1.05 possível
- Uso: Pesquisa; clusters de alta densidade
Rear-Door Heat Exchangers (RDHx)
- Trocador de calor na porta traseira do rack
- Remove calor do ar quente antes de sair para a sala
- Incremento sobre air cooling; sem mudanças no servidor
- Eficaz para racks até 40 kW
Uso de Água
WUE — Water Usage Effectiveness
WUE = Volume de água evaporada / Energia dos servidores
- Resfriamento a ar com torre de resfriamento evapora água
- Data center de 100 MW pode evaporar 2–5 milhões de litros de água por dia
| Empresa | WUE (2024) | Método |
|---|---|---|
| 0.96 L/kWh | Reaproveitamento em áreas frias | |
| Microsoft | 0.3 L/kWh | DLC closed-loop em novos DCs |
| Amazon | 1.8 L/kWh | Evaporação em torres |
*mpacto local:*Preocupações em regiões com escassez hídrica (Arizona, Nevada, Holanda)
Fontes de Energia
| Empresa | Compromisso de Energia Renovável |
|---|---|
| 100% renovável desde 2017 (compra de créditos) | |
| Microsoft | 100% renovável até 2025 (contratos PPAs) |
| Meta | 100% renovável; carbono negativo até 2030 |
| Amazon/AWS | 85% renovável em 2024; 100% meta 2025 |
| xAI (Grok) | Memphis, TN — mix coal/gas; controverso |
*roblema:*"100% renovável" frequentemente significa créditos de carbono (RECs), não energia literal renovável 24/7.
*arbon Intensity por Região:*
- França: 56 gCO₂/kWh (nuclear)
- Islândia: 0 gCO₂kWh (geotérmicahidro)
- EUA (média): 386 gCO₂/kWh
- Polônia: 713 gCO₂/kWh (carvão)
Recursos Naturais — Minerais Críticos em GPUs
Materiais em uma GPU H100
| Material | Uso | Origem Principal | Risco |
|---|---|---|---|
| *obre* | Interconexões, PCB | Chile, Peru | Baixo |
| *ilício* | Chip base | Areia de quartzo global | Baixo |
| *ungstênio* | Vias (TSV) | China (85%), Rússia | Alto |
| *obalto* | Capacitores, bateria backup | Congo DRC (70%) | ALTO — conflito |
| *ítio* | Baterias no DC | Chile, Austrália | Médio |
| *ântalo* | Capacitores | Congo DRC, Ruanda | ALTO — conflito |
| *ndio* | Telas, soldas | China (60%) | Médio |
| *álio* | GaAs compounds | China (95%) | CRÍTICO (exportações restritas desde 2023) |
| *ermânio* | Fibra ótica, chips | China (60%) | CRÍTICO (exportações restritas) |
| *eodímio* | Magnetos (cooling fans) | China (70%) | Alto |
| *isprosio* | Magnetos de alta temp | China (monopolio) | CRÍTICO |
| *érbio* | Magnetos, lasers | China (monopolio) | CRÍTICO |
Terras Raras (Rare Earth Elements — REEs)
- 17 elementos (lantânio, cério, neodímio, etc.)
- China controla ~60% da produção; ~85% do processamento
- Uso: Magnetos permanentes (ventoinhas, motores), lasers, fosforescentes
- China restringiu exportações em 2023 → impacto na cadeia de suprimentos
Conflito Mineral no Congo (DRC)
- Congo: 70% do cobalto mundial, tântalo significativo
- *inas artesanais (ASM):*20% da produção com trabalho infantil documentado
- *ertificações:*RMI (Responsible Minerals Initiative), EICC
- NVIDIA, AMD, Intel têm políticas de due diligence, mas rastreabilidade é difícil
- *lternativas em pesquisa:*Baterias sem cobalto (LiFePO4); capacitores MLCC alternativos
Resíduos Eletrônicos (E-waste)
- *ida útil de uma GPU de data center:*3–5 anos
- *-waste global (2023):*53 milhões de toneladas métricas/ano
- *eciclagem real:*Apenas ~17% é reciclado formalmente
- *ressão:*Regulação EU WEEE (Waste Electrical and Electronic Equipment)
- *niciativas:*Google recondicionamento; Dell Asset Recovery; AWS Refurb program
Sustentabilidade no Desenvolvimento de IA
Métricas de Eficiência
- *LOPS/Watt:*Blackwell B200 ≈ 3× mais eficiente que H100 por FLOPS de inferência
- *okens/Watt:*Inferência de Llama 3 8B em M2 Ultra ≈ 10× mais eficiente que H100 cloud
- *ompute-optimal training:*Chinchilla (20 tokens/parâmetro) evita desperdício de compute
Modelos Menores com Mesma Qualidade
- *hi-4 (14B):*Performance de modelos 70B em STEM — 5× menos energia
- *wen2.5
Coder7B:*Supera modelos 13B+ de 2023 — 2× menos energia por query - *istilação:*DeepSeek
R17B tem 70% da capacidade do 70B — 10× menos energia
Green AI
- *rtigo fundacional:*"Energy and Policy Considerations for Deep Learning in NLP" (Strubell et al., 2019)
- *MCE (Marginal Carbon-aware Model Evaluation):*Benchmark levando em conta custo energético
- *niciativa:*MLCommons Power Track; Energy Star para servidores de IA