# 📘 Módulo 1 – Introdução à Análise Descritiva de Dados (Parte 1)

Este roteiro é voltado para a compreensão inicial de como analisar dados de energia elétrica, com exemplos reais do Smart Campus UFCG.

OBS:

1.   Adicionar os exemplos em imagens do material de visualização de dados
2.   Adequar as explicações para uma forma mais detalhada nos tópicos 2 e 3
3.   Realizar o roteiro inteiro para ver falhas, bugs e correções.
4.   Atualizar a planilha para a versão mais recente 2025.
5.   Adicionar exemplo de desafio parecido com um roteiro de LP2.




---

## 🔌 1. Coleta e Armazenamento de Dados

O primeiro passo da análise de dados é entender **de onde os dados vêm** e **como são organizados**.

🧾 Neste curso, usaremos dados reais extraídos de sensores do campus, armazenados em planilhas.

📌 Os dados que vamos utilizar estão organizados da seguinte forma:

- **Data e Hora**
- **Consumo de Energia (kWh)**
- **Tensão (V)**
- **Corrente (A)**
- **Local do Medidor**

⬇️ Execute a célula abaixo para carregar a planilha:


In [None]:
import pandas as pd


#primeramente, tente baixar a planilha disponível no link:
Após isso, anexe a planilha nese roteiro, pois ela será a base de dados que será utilizada nos exemplos.
# Carregando o arquivo
df = pd.read_excel('/content/liteme-data--01-03-2024.xlsx')
df.head()


---

## 🧩 2. Tipos de Variáveis

Vamos entender os **tipos de variáveis** presentes no nosso conjunto de dados.

- **Qualitativas Nominais**: categorizam sem ordem (ex: Local do Medidor)
- **Qualitativas Ordinais**: categorizam com ordem (ex: Nível de Tensão: "Alta", "Média", "Baixa")
- **Quantitativas Discretas**: números contáveis (ex: quantidade de eventos)
- **Quantitativas Contínuas**: valores em uma escala contínua (ex: consumo em kWh)

---

## 🔍 3. Exemplo com os Dados de Energia

Vamos identificar as variáveis do nosso dataset:

| Coluna             | Tipo de Variável                  |
|--------------------|-----------------------------------|
| Data e Hora        | Temporal                          |
| Local do Medidor   | Qualitativa Nominal               |
| Tensão (V)         | Quantitativa Contínua             |
| Corrente (A)       | Quantitativa Contínua             |
| Consumo (kWh)      | Quantitativa Contínua             |

📷 **[Espaço para inserir imagem da planilha com destaque nas colunas acima]**

---

## 🎯 4. Variáveis Qualitativas

Vamos observar a distribuição dos locais onde os medidores estão instalados:


In [None]:
df['Local'].value_counts().plot(kind='bar', title='Distribuição dos Medidores por Local')

##🧮 5. Variáveis Quantitativas
a) Discretas
Variáveis discretas são contagens. Exemplo: número de registros por dia.

In [None]:
df['Data'] = pd.to_datetime(df['Data e Hora']).dt.date
df.groupby('Data').size().plot(kind='line', title='Número de Registros por Dia')


b) Contínuas
Vamos analisar o consumo de energia:

In [None]:
df['Consumo (kWh)'].plot(kind='hist', bins=30, title='Distribuição do Consumo (kWh)')


##📊 6. Distribuição de Frequência
Vamos estudar a distribuição de consumo:

In [None]:
consumo_freq = pd.cut(df['Consumo (kWh)'], bins=5).value_counts().sort_index()
consumo_freq.plot(kind='bar', title='Distribuição de Frequência - Consumo (kWh)')
