# Projeto de Análise - Household Power Consumption

In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


## Questão 1: Carregar dataset e exibir as 10 primeiras linhas

In [None]:

df = pd.read_csv(
    "household_power_consumption.txt",
    sep=";",
    decimal=".",
    na_values="?"
)
df.head(10)


## Questão 2: Diferença entre Global_active_power e Global_reactive_power


- **Global_active_power**: potência ativa consumida pela residência, medida em kW, que realmente realiza trabalho útil (ex: funcionamento de aparelhos).
- **Global_reactive_power**: potência reativa, medida em kW, que não realiza trabalho útil mas é necessária para manter os campos elétricos/magnéticos nos equipamentos.


## Questão 3: Valores ausentes

In [None]:

missing = df.isna().sum()
print(missing)
print("Total de valores ausentes:", missing.sum())


## Questão 4: Converter Date para datetime e criar coluna dia da semana

In [None]:

df['Date'] = pd.to_datetime(df['Date'], format="%d/%m/%Y")
df['DayOfWeek'] = df['Date'].dt.day_name()
df[['Date','DayOfWeek']].head()


## Questão 5: Filtrar ano 2007 e calcular média de consumo diário de Global_active_power

In [None]:

df_2007 = df[df['Date'].dt.year == 2007]
daily_avg_2007 = df_2007.groupby('Date')['Global_active_power'].mean()
daily_avg_2007.head()


## Questão 6: Gráfico de linha de Global_active_power em um único dia

In [None]:

day_sample = df_2007[df_2007['Date'] == '2007-01-01']
plt.figure(figsize=(12,5))
plt.plot(day_sample['Global_active_power'].reset_index(drop=True))
plt.title("Variação do Global Active Power em 2007-01-01")
plt.xlabel("Minutos do dia")
plt.ylabel("Potência ativa (kW)")
plt.show()


## Questão 7: Histograma de Voltage

In [None]:

plt.figure(figsize=(8,5))
plt.hist(df['Voltage'].dropna(), bins=50, edgecolor='black')
plt.title("Distribuição da variável Voltage")
plt.xlabel("Voltagem (V)")
plt.ylabel("Frequência")
plt.show()


**Observação:** A distribuição é aproximadamente normal, centrada em torno de 240 volts, com pouca variação.

## Questão 8: Consumo médio por mês em todo o período

In [None]:

df['YearMonth'] = df['Date'].dt.to_period('M')
monthly_avg = df.groupby('YearMonth')['Global_active_power'].mean()
monthly_avg.head()


## Questão 9: Dia com maior consumo de energia ativa global

In [None]:

daily_sum = df.groupby('Date')['Global_active_power'].sum()
max_day = daily_sum.idxmax()
max_day, daily_sum.max()


## Questão 10: Comparação consumo médio em dias de semana vs finais de semana

In [None]:

df['IsWeekend'] = df['DayOfWeek'].isin(['Saturday','Sunday'])
weekday_avg = df.groupby('IsWeekend')['Global_active_power'].mean()
weekday_avg


In [None]:

labels = ['Dias de semana','Finais de semana']
plt.bar(labels, weekday_avg)
plt.title("Consumo médio Global Active Power - Semana vs Fim de semana")
plt.ylabel("Potência ativa (kW)")
plt.show()
