# Redes Neurais nos Exames de Bruxo de Hogwarts

### Descriçao

---
1. O objetivo deste notebook é aprender sobre Redes Neurais Artificias
2. Vamos construir um conjunto de dados baseado no universo do Harry Potter
3. O problema consiste em prever qual a nota do aluno
---

### Dicionário


Fields	                                                  | Type  	  |    Description                              |
----------------------------------------------------------|:---------:|:-------------------------------------------:|
student 	  										  	  |string     | name of participants	                    |
age														  |integer    | age of participants                         |
houses		     										  |string     | house of participants		                |
spell												  |float      | subject									    |
hours_of_studie											  |integer    | time spend in studie	     			    |
hours_of_practice										 |integer    | time spend in practice	     			    |
alchemy            										  |float     | subject                                     |


----
### Objetivos

1. O problema consiste em criar uma rede neural capaz de prever a nota que o aluno vai tirar em determinada materia.
2. Vamos construir um conjunto de dados historicos desses alunos e dividi-los em teste e treino.
3. Variaveis independentes (Horas de Estudo e Horas de Pratica)
4. Variavel alvo (Qualquer materia)
---


### Baixando os pacotes

In [None]:
!pip install pandas numpy scikit-learn keras Faker


### Documentação

1. ** Pandas ** -> [Link](https://pandas.pydata.org/docs/)
2. ** Numpy ** -> [Link](https://numpy.org/doc/)
3. ** Faker ** -> [Link](https://faker.readthedocs.io/en/master/)
4. ** Scikit Learn ** -> [Link](https://scikit-learn.org/stable/)
5. ** Keras ** -> [Link](https://keras.io/api/)
6. ** Tensor Flow ** -> [Tensor Flow](https://www.tensorflow.org/api_docs/python/tf/keras)


In [None]:
import pandas as pd
import numpy as np
import random
from faker import Faker
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from keras.models import Sequential
from keras.layers import Dense, Dropout
from tensorflow.keras.utils import plot_model

# Construindo o Dataset Faker

In [None]:

def generate(num):
    fake = Faker() #criando o metodo de nomes falsos
    data = []
    subjects = ['spell', 'alchemy'] #lista de materias

    for _ in range(num):
        student = fake.name()
        age = random.randint(11, 39)
        house = random.choice(['Gryffindor', 'Slytherin', 'Ravenclaw', 'Hufflepuff'])
        hours_of_studie = random.randint(1,24)
        hours_of_practice = random.randint(1, 24)
        row = {
            'student': student,
            'age': age,
            'house': house,
            'hours_of_studie': hours_of_studie,
            'hours_of_practice': hours_of_practice,
        }
        for subject in subjects:
            row[subject] = round(random.uniform(0,10),2)
        data.append(row)

    df = pd.DataFrame(data)
    return df

df = generate(1000)
df


### Criando nosso modelo de rede neural

In [None]:
# Definir as variáveis independentes e a variável alvo
X = df[['hours_of_studie', 'hours_of_practice']]
y = df['spell']  # ou 'alchemy' como variável alvo

# Dividir os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Normalizar os dados
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Construir o modelo da rede neural
modelo = Sequential()
modelo.add(Dense(units=64, activation='relu', input_dim=X_treino.shape[1]))
modelo.add(Dropout(0.4))
modelo.add(Dense(units=32, activation='relu'))
modelo.add(Dropout(0.4))
modelo.add(Dense(units=64, activation='relu'))
modelo.add(Dropout(0.4))
modelo.add(Dense(units=1, activation='sigmoid'))

# Compilar o modelo
modelo.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
modelo.fit(X_treino, y_treino, epochs=50, batch_size=32)

# Treinar o modelo

# Avaliar o modelo
loss = modelo.evaluate(X_test, y_test)
print(f'Loss: {loss}')

# Fazer previsões
predictions = modelo.predict(X_test)

### Visualizando nossa rede neural

In [None]:
plot_model(modelo, to_file='modelo.png', rankdir="LR", show_shapes=True, show_layer_names=True)

### Testando nosso modelo

In [None]:
df.head(4)

# Confirmando nossa classificação

In [None]:
# Selecionar os quatro primeiros itens do DataFrame
test_data = df[['hours_of_studie', 'hours_of_practice', 'spell']].head(4)

# Normalizar os dados de teste
X_test = scaler.transform(test_data[['hours_of_studie', 'hours_of_practice']])

# Gerar previsões para os quatro primeiros itens
predictions = modelo.predict(X_test)

# Comparar previsões com as notas reais
for i, prediction in enumerate(predictions):
    print(f'Previsão: {prediction[0]}, Nota Real: {test_data.iloc[i]["spell"]}')


# Confirmando com novos valores

In [None]:
new_df = generate(4)

X_test = scaler.transform(test_data[['hours_of_studie', 'hours_of_practice']]) # Normalizar os novos dados


# Gerar previsões
predictions = modelo.predict(X_test)

# Exibir as previsões
for i, prediction in enumerate(predictions):
    print(f'Previsão: {prediction[0]}, Nota Real: {test_data.iloc[i]["spell"]}')

### Avaliando o Modelo

In [None]:
X_all = scaler.transform(df[['hours_of_studie', 'hours_of_practice']])
predictions_all = modelo.predict(X_all)

y_true = df['spell']  # ou 'alchemy' como variável alvo
y_pred = predictions_all.flatten()

# Calcular o erro médio absoluto (MAE)
mae = mean_absolute_error(y_true, y_pred)

# Calcular o erro quadrático médio (MSE)
mse = mean_squared_error(y_true, y_pred)

# Calcular o coeficiente de determinação (R²)
r2 = r2_score(y_true, y_pred)

print(f'Erro Médio Absoluto (MAE): {mae}') # O MAE é a média das diferenças absolutas entre as previsões do modelo e os valores reais. Em outras palavras, ele mede o quão perto as previsões estão dos valores reais, sem considerar a direção. Um MAE mais baixo indica que o modelo está fazendo previsões mais precisas.
print(f'Erro Quadrático Médio (MSE): {mse}')
print(f'Coeficiente de Determinação (R²): {r2}')

### Inferencia

um MAE de aproximadamente 4.13 significa que, em média, as previsões do seu modelo estão a cerca de 4.13 unidades de distância dos valores reais. Um MSE de aproximadamente 24.51 indica que, em média, o quadrado da diferença entre as previsões e os valores reais é de aproximadamente 24.51. O coeficiente de determinação negativo indica que o modelo não se ajustou bem aos dados, sugerindo que há outros fatores não considerados pelo modelo que afetam as notas dos alunos.