# **Gestão Preditiva de Infraestrutura Digital**

---

**Discentes**:
- Ariane Santos De Queiroz
- Fábio Luiz Souza Alves
- Gabriel Vilela Firmo
- Isabela Maria Melle Baptista
- Murilo Couto de Oliveira
- Vitória Karoline De L. G. Silva

---

## Resumo da Atividade:

> Aplicação de modelos preditivos para gestão preditiva de datacenters de uma empresa de tecnologia. O trabalho foca na previsão e mitigação de sobrecargas nos sistemas durante eventos críticos e condições climáticas adversas, com o objetivo de otimizar o desempenho operacional e garantir a continuidade dos serviços.

## Universidade de São Paulo
- Instituto de Ciências Matemáticas e de Computação – ICMC
- Disciplina: MAI 5003 – Probabilidade e Estatística
- Semestre: 2º Semestre de 2025
- Docente: Prof. Dr. Francisco Louzada Neto

---

## Descrição Geral

> Esta tarefa aplica análise de dados e modelagem preditiva de infraestrutura tecnológica de um datacenter, com foco na **predição do número de requisições** durante o aumento de demanda ocasionado por eventos extremos.

> Os dados simulados representam o número de requisições, incluindo variáveis como requisições por hora, tráfego de rede, número de usuários ativos, uso de CPU e RAM, entre outros.

---

## Objetivos da tarefa e fluxo da solução proposta

- Implementar modelo preditivo para número de requisições, adaptado ao contexto de **infraestrutura digital crítica**:
  1. **Pré-processamento, limpeza e análise de dados**: captura dados temporais incluindo requisições, consumo de energia, temperatura ambiente e etc.
  2. **Engenharia de atributos**: cálculo e geração de novos atributos para gerar insights e interpretar os dados do problema.
  3. **Divisão da base de dados em conjuntos de treino/tese**: divisão em conjuntos de treino/validação e teste respeitando a ordem temporal com o objetivo de avaliar as métricas regressivas.
  3. **Modelagem**: avaliação das métricas para diversos modelos preditivoscom validação cruzada.  
  4. **Desempenho dos modelos no conjunto de teste**: avalia desempenho dos modelos no conjunto de teste tal como o impacto do horizonte preditivo nas métricas de regressão.

---

# Metadados

## Descrição resumida
> Base de dados de um datacenter de uma empresa de tecnologia

- timestamp (datetime64[ns]): Ano, mês e dia do evento
- hora_dia (int64): Hora do evento
- dia_semana (int64): Dia da semana
- reqs (int64): Número de requisições via app
- trafego_MBps (int64): Quantidade de dados em tráfego (MBps)
- usuarios_ativos (int64): Quantidade de usuários ativos
- temp_ambiente_C (float64): Temperatura ambiente em graus Celsius
- uso_cpu_% (float64): Percentual de uso de CPU
- uso_ram_% (float64): Percentual de uso de memória RAM
- demanda_energia_KW (float64): Demanda energética estimada
- pressao_resfriamento_bar (float64): Pressão de resfriamento (bar)
- consumo_agua_m3 (float64): Consumo de água (m3)

---

# Motivação do Problema e Contextualização

A operação contínua de datacenters é um requisito fundamental para empresas de tecnologia, cujos serviços e produtos digitais dependem integralmente da disponibilidade e confiabilidade de sua infraestrutura computacional [1]. A interrupção desses serviços, mesmo que por breves períodos, acarreta prejuízos financeiros significativos, compromete a reputação corporativa e pode resultar na perda de confiança por parte dos clientes.

O problema investigado nesta pesquisa concerne à previsão precisa da carga de trabalho em ambientes de datacenter, um fator crítico para o planejamento de capacidade e a alocação proativa de recursos. A motivação para este estudo é dupla: primeiro, a necessidade de garantir a estabilidade do sistema durante eventos de demanda extrema, como picos de acesso sazonais ou promocionais; e segundo, a imperativa otimização da eficiência energética, especialmente sob condições ambientais adversas, como ondas de calor, que exercem pressão adicional sobre os sistemas de resfriamento e elevam o risco de superaquecimento e falhas de hardware [2].

Para endereçar esta problemática, este trabalho baseia-se em um conjunto de dados multivariados e temporais coletados da operação de um datacenter, compreendendo as seguintes variáveis-chave:
-   `timestamp (datetime64[ns])`: data da coleta do evento.
-   `hora_dia (int64)`: hora do dia do evento.
-   `dia_semana (int64)`: dia da semana.
-   `reqs (int64)`: número total de requisições via aplicativo.
-   `trafego_MBps (int64)`: volume de dados em tráfego (MBps).
-   `usuarios_ativos (int64)`: quantidade de usuários ativos concorrentes.
-   `temp_ambiente_C (float64)`: temperatura ambiente do datacenter (°C).
-   `uso_cpu_% (float64)`: percentual de utilização da CPU.
-   `uso_ram_% (float64)`: percentual de utilização da memória RAM.
-   `demanda_energia_KW (float64)`: demanda energética estimada (KW).
-   `pressao_resfriamento_bar (float64)`: pressão no sistema de resfriamento (bar).
-   `consumo_agua_m3 (float64)`: consumo de água do sistema de resfriamento (m³).

O objetivo principal é desenvolver um modelo preditivo para a variável `reqs` (número de requisições). A previsão precisa desta métrica é o principal indicador para a carga iminente no sistema. A hipótese é de que a carga de trabalho possui correlações identificáveis não apenas com fatores de demanda direta (como `usuarios_ativos` e `hora_dia`), mas também com métricas operacionais do datacenter (como `uso_cpu_%` e `temp_ambiente_C`) e variáveis de infraestrutura (como `demanda_energia_KW`).

A capacidade de prever a carga de requisições permitirá uma gestão mais eficiente dos recursos computacionais e dos sistemas de suporte, como refrigeração e energia, antecipando necessidades e mitigando riscos de sobrecarga. Este modelo contribuirá para a otimização do desempenho operacional e da eficiência energética, assegurando a robustez necessária para a manutenção dos serviços críticos.

---

## Referências

- [1] BARROSO, L. A.; CLOUDŚ, U.; HÖLZLE, U. **The Datacenter as a Computer: Designing Warehouse-Scale Machines**. Synthesis Lectures on Computer Architecture, 2018.

- [2] DAYARATHNA, M.; WEN, Y.; FAN, R. **Data Center Energy Consumption Modeling: A Survey**. IEEE Communications Surveys & Tutorials, 2016.

---