# GS_IA_ML
### Arthur Fenili RM 552752
### Enzo Antunes Oliveira RM 553185
### Vinicío Raphael RM 553813

# Importações

In [3]:
# Importações
!pip install pdfplumber
import pdfplumber
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import MinMaxScaler
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from sklearn.impute import SimpleImputer
warnings.filterwarnings("ignore")



# Treinamento da IA para Predição de Consumo de Energia

### Micro-Ondas

In [4]:
# Pre-processamento para Micro-ondas
df_micro_ondas = pd.read_csv('/content/Micro-Ondas.csv')

# Transformando variáveis categóricas em dummies
categorical_cols = ['fornecedor', 'marca', 'modelo', 'voltagem', 'consumo_modo_espera', 'eficiencia_energetica', 'classificacao']
df_micro_ondas = pd.get_dummies(df_micro_ondas, columns=categorical_cols, drop_first=True)

# Separando variáveis independentes e dependentes
X_micro_ondas = df_micro_ondas.drop('potencia_nominal', axis=1)
y_micro_ondas = df_micro_ondas['potencia_nominal']

# Dividindo em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_micro_ondas, y_micro_ondas, test_size=0.2, random_state=42)

# Treinando o modelo
model_micro_ondas = LinearRegression()
model_micro_ondas.fit(X_train, y_train)

# Avaliação
y_pred = model_micro_ondas.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
print("Micro-ondas - MAE:", mae, "RMSE:", rmse)


Micro-ondas - MAE: 2.8577093662236015 RMSE: 3.5587460703049683


### Máquina de Lavar

In [5]:
# Pre-processamento para Lavadoras Automáticas
df_lavadoras = pd.read_csv('/content/Lavadoras_Automaticas.csv')

# Removendo linhas onde 'capacidade_kg' não é um valor numérico
df_lavadoras = df_lavadoras[pd.to_numeric(df_lavadoras['capacidade_kg'], errors='coerce').notnull()]
df_lavadoras['capacidade_kg'] = df_lavadoras['capacidade_kg'].astype(float)

# Transformando variáveis categóricas em dummies
categorical_cols = ['fabricante', 'marca', 'modelo', 'voltagem', 'eficiencia_lavagem', 'eficiencia_centrifugacao']
df_lavadoras = pd.get_dummies(df_lavadoras, columns=categorical_cols, drop_first=True)

# Preenchendo valores ausentes com a média
imputer = SimpleImputer(strategy='mean')
df_lavadoras = pd.DataFrame(imputer.fit_transform(df_lavadoras), columns=df_lavadoras.columns)

# Separando variáveis independentes e dependentes
X_lavadoras = df_lavadoras.drop('consumo_energia', axis=1)
y_lavadoras = df_lavadoras['consumo_energia']

# Dividindo em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_lavadoras, y_lavadoras, test_size=0.2, random_state=42)

# Treinando o modelo
model_lavadoras = LinearRegression()
model_lavadoras.fit(X_train, y_train)

# Avaliação
y_pred = model_lavadoras.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
print("Lavadoras - MAE:", mae, "RMSE:", rmse)


Lavadoras - MAE: 0.015619290747559201 RMSE: 0.02018615673759997


### Ventiladores de Mesa

In [6]:
# Carregar o arquivo CSV
df_ventiladores = pd.read_csv('/content/Ventiladores_de_Mesa.csv')

# Substituir valores não numéricos como '-' por NaN
df_ventiladores.replace('-', np.nan, inplace=True)

# Remover a unidade 'W' da coluna 'potencia' e converter para numérico
df_ventiladores['potencia'] = df_ventiladores['potencia'].replace('W', '', regex=True).astype(float)

# Transformar variáveis categóricas em dummies
categorical_cols = ['fornecedor', 'marca', 'modelo', 'voltagem', 'material_helice', 'material_grade']
df_ventiladores = pd.get_dummies(df_ventiladores, columns=categorical_cols, drop_first=True)

# Preencher valores ausentes com a média nas colunas numéricas
numerical_cols = df_ventiladores.select_dtypes(include=[np.number]).columns
imputer = SimpleImputer(strategy='mean')
df_ventiladores[numerical_cols] = imputer.fit_transform(df_ventiladores[numerical_cols])

# Separar variáveis independentes e dependentes
X_ventiladores = df_ventiladores.drop('potencia', axis=1)
y_ventiladores = df_ventiladores['potencia']

# Dividir em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_ventiladores, y_ventiladores, test_size=0.2, random_state=42)

# Treinar o modelo
model_ventiladores = LinearRegression()
model_ventiladores.fit(X_train, y_train)

# Avaliação
y_pred = model_ventiladores.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
print("Ventiladores - MAE:", mae, "RMSE:", rmse)


Ventiladores - MAE: 8.60284721252423 RMSE: 10.602895874706418


### Ventiladores de Teto

In [7]:
# Pre-processamento para Ventiladores de Teto
df_ventiladores_teto = pd.read_csv('/content/Ventiladores_de_Teto.csv')

# Transformando variáveis categóricas em dummies
categorical_cols = ['fornecedor', 'marca', 'modelo', 'voltagem', 'material_helice', 'controle_velocidade']
df_ventiladores_teto = pd.get_dummies(df_ventiladores_teto, columns=categorical_cols, drop_first=True)

# Separando variáveis independentes e dependentes
X_ventiladores_teto = df_ventiladores_teto.drop(['potencia_alta', 'potencia_media', 'potencia_baixa'], axis=1)
y_ventiladores_teto = df_ventiladores_teto['potencia_alta']

# Dividindo em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_ventiladores_teto, y_ventiladores_teto, test_size=0.2, random_state=42)

# Treinando o modelo
model_ventiladores_teto = LinearRegression()
model_ventiladores_teto.fit(X_train, y_train)

# Avaliação
y_pred = model_ventiladores_teto.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
print("Ventiladores de Teto - MAE:", mae, "RMSE:", rmse)


Ventiladores de Teto - MAE: 4.495425522647858 RMSE: 5.7872067479842775


# Interação com o Usuário

In [23]:
# Importações necessárias
import pandas as pd

# Usando os modelos pré-treinados
modelos = {
    'Micro-ondas': model_micro_ondas,
    'Lavadora': model_lavadoras,
    'Ventilador de Mesa': model_ventiladores,
    'Ventilador de Teto': model_ventiladores_teto
}

# Colunas dummy para compatibilidade com as previsões
dummies = {
    'Micro-ondas': X_micro_ondas.columns.tolist(),
    'Lavadora': X_lavadoras.columns.tolist(),
    'Ventilador de Mesa': X_ventiladores.columns.tolist(),
    'Ventilador de Teto': X_ventiladores_teto.columns.tolist()
}

# Dados de opções para cada categoria, usados na interação
dados_unicos = {
    'Micro-ondas': {'marca': ['ARNO', 'MALLORY'], 'modelo': ['Silence Force'], 'voltagem': ['127', '220']},
    'Lavadora': {'marca': ['LG', 'SAMSUNG'], 'modelo': ['Turbo'], 'voltagem': ['127', '220']},
    'Ventilador de Mesa': {'marca': ['ARNO', 'MALLORY'], 'modelo': ['Silence Force', 'Turbo Silence'], 'voltagem': ['127', '220']},
    'Ventilador de Teto': {'marca': ['ARNO'], 'modelo': ['Sky'], 'voltagem': ['127', '220']}
}

# Função de previsão interativa com escolha de entrada pelo usuário
def prever_consumo_interativo():
    # Escolher categoria
    print("Selecione o tipo de eletrodoméstico:")
    categorias = list(modelos.keys())
    for i, categoria in enumerate(categorias, 1):
        print(f"{i}. {categoria}")
    categoria_idx = int(input("Digite o número correspondente à categoria: ")) - 1
    categoria = categorias[categoria_idx]

    # Escolher marca
    print(f"\nVocê selecionou {categoria}. Escolha a marca:")
    marcas = dados_unicos[categoria]['marca']
    for i, marca in enumerate(marcas, 1):
        print(f"{i}. {marca}")
    marca_idx = int(input("Digite o número correspondente à marca: ")) - 1
    marca = marcas[marca_idx]

    # Escolher modelo
    print("\nEscolha o modelo:")
    modelos_disponiveis = dados_unicos[categoria]['modelo']
    for i, modelo in enumerate(modelos_disponiveis, 1):
        print(f"{i}. {modelo}")
    modelo_idx = int(input("Digite o número correspondente ao modelo: ")) - 1
    modelo = modelos_disponiveis[modelo_idx]

    # Escolher voltagem
    print("\nEscolha a voltagem:")
    voltages = dados_unicos[categoria]['voltagem']
    for i, voltagem in enumerate(voltages, 1):
        print(f"{i}. {voltagem}")
    voltagem_idx = int(input("Digite o número correspondente à voltagem: ")) - 1
    voltagem = voltages[voltagem_idx]

    # Preparar dados do usuário
    dados_usuario = {'marca': marca, 'modelo': modelo, 'voltagem': voltagem}
    df_dados_usuario = pd.DataFrame([dados_usuario])
    df_dados_usuario = pd.get_dummies(df_dados_usuario)
    df_dados_usuario = df_dados_usuario.reindex(columns=dummies[categoria], fill_value=0)

    # Realizando a previsão
    previsao = modelos[categoria].predict(df_dados_usuario)
    print(f"\nPrevisão de consumo de energia para {categoria} ({marca} {modelo} {voltagem}V): {previsao[0]:.2f} kWh")

# Executar a função interativa
prever_consumo_interativo()


Selecione o tipo de eletrodoméstico:
1. Micro-ondas
2. Lavadora
3. Ventilador de Mesa
4. Ventilador de Teto
Digite o número correspondente à categoria: 1

Você selecionou Micro-ondas. Escolha a marca:
1. ARNO
2. MALLORY
Digite o número correspondente à marca: 1

Escolha o modelo:
1. Silence Force
Digite o número correspondente ao modelo: 1

Escolha a voltagem:
1. 127
2. 220
Digite o número correspondente à voltagem: 2

Previsão de consumo de energia para Micro-ondas (ARNO Silence Force 220V): 20.43 kWh
