### 1)

In [17]:
import pandas as pd
import numpy as np

# 1. Ler o dataset
household_df = pd.read_csv(
    "household_power_consumption.txt",
    sep=";",                # separador usado no arquivo
    na_values="?",           # "?" indica valor ausente
    dtype={'Global_active_power': 'float64',
           'Global_reactive_power': 'float64',
           'Voltage': 'float64',
           'Global_intensity': 'float64',
           'Sub_metering_1': 'float64',
           'Sub_metering_2': 'float64',
           'Sub_metering_3': 'float64'}
)



# 2. Criar coluna DataTime
household_df['DataTime'] = pd.to_datetime(
    household_df['Date'] + ' ' + household_df['Time'],
    format='%d/%m/%Y %H:%M:%S'
)

# 3. Remover colunas antigas
household_df.drop(['Date', 'Time'], axis=1, inplace=True)

# 4. Definir DataTime como índice
household_df.set_index('DataTime', inplace=True)

# 5. Criar coluna com consumo de aparelhos não medidos
household_df['Outros_Consumos_Wh'] = (
    household_df['Global_active_power'] * 1000 / 60
    - household_df['Sub_metering_1']
    - household_df['Sub_metering_2']
    - household_df['Sub_metering_3']
)

# 6. Mostrar primeiras linhas
print(household_df.head(10))


                     Global_active_power  Global_reactive_power  Voltage  \
DataTime                                                                   
2006-12-16 17:24:00                4.216                  0.418   234.84   
2006-12-16 17:25:00                5.360                  0.436   233.63   
2006-12-16 17:26:00                5.374                  0.498   233.29   
2006-12-16 17:27:00                5.388                  0.502   233.74   
2006-12-16 17:28:00                3.666                  0.528   235.68   
2006-12-16 17:29:00                3.520                  0.522   235.02   
2006-12-16 17:30:00                3.702                  0.520   235.09   
2006-12-16 17:31:00                3.700                  0.520   235.22   
2006-12-16 17:32:00                3.668                  0.510   233.99   
2006-12-16 17:33:00                3.662                  0.510   233.86   

                     Global_intensity  Sub_metering_1  Sub_metering_2  \
DataTime      

### 2) 

$Global$ $Active$ $Power$ ou potência ativa, é a energia que realiza o trabalho. É a parte da energia elétrica que é convertida em outras formas de energia, como calor, luz, etc.


$Global$ $Reactive$ $Power$ ou potência reativa é a energia que não realiza trabalho útil. Ela cria e mantém os campos eletromagnéticos em equipamentos indutivos e capacitivos.


### 3)

In [8]:

household_df.replace('?', np.nan, inplace=True)

# Conta os valores nulos (NaN) em cada coluna
valores_ausentes = household_df.isnull().sum()

# Filtra para mostrar só as colunas que têm valores ausentes
quantidade_valores_ausentes = valores_ausentes[valores_ausentes > 0]


if not quantidade_valores_ausentes.empty:
    print("Quantidade de valores ausentes por coluna:")
    print(quantidade_valores_ausentes)
else:
    print("Não tem valores ausentes")

Quantidade de valores ausentes por coluna:
Global_active_power      25979
Global_reactive_power    25979
Voltage                  25979
Global_intensity         25979
Sub_metering_1           25979
Sub_metering_2           25979
Sub_metering_3           25979
Outros_Consumos_Wh       25979
dtype: int64


In [6]:
# Criar tabela de resumo diário
resumo_diario = household_df.resample('D').agg({
    'Global_active_power': 'mean',
    'Global_reactive_power': 'mean',
    'Voltage': 'mean',
    'Global_intensity': 'mean',
    'Sub_metering_1': 'sum',
    'Sub_metering_2': 'sum',
    'Sub_metering_3': 'sum',
    'Outros_Consumos_Wh': 'sum'
})

# Renomear colunas para facilitar leitura
resumo_diario.rename(columns={
    'Global_active_power': 'Potência Ativa Média (kW)',
    'Global_reactive_power': 'Potência Reativa Média (kW)',
    'Voltage': 'Tensão Média (V)',
    'Global_intensity': 'Corrente Média (A)',
    'Sub_metering_1': 'Consumo Cozinha (Wh)',
    'Sub_metering_2': 'Consumo Lavanderia (Wh)',
    'Sub_metering_3': 'Consumo Aquecimento/Ar (Wh)',
    'Outros_Consumos_Wh': 'Outros Consumos (Wh)'
}, inplace=True)

# Exibir tabela
print(resumo_diario.head(100))  # mostra os primeiros 10 dias


            Potência Ativa Média (kW)  Potência Reativa Média (kW)  \
DataTime                                                             
2006-12-16                   3.053475                     0.088187   
2006-12-17                   2.354486                     0.156949   
2006-12-18                   1.530435                     0.112356   
2006-12-19                   1.157079                     0.104821   
2006-12-20                   1.545658                     0.111804   
...                               ...                          ...   
2007-03-21                   1.487564                     0.099188   
2007-03-22                   1.010401                     0.079046   
2007-03-23                   0.909033                     0.082978   
2007-03-24                   2.061410                     0.132656   
2007-03-25                   2.318363                     0.163983   

            Tensão Média (V)  Corrente Média (A)  Consumo Cozinha (Wh)  \
DataTime       