<a href="https://colab.research.google.com/github/GustMont/Implementacao_de_Rede_Neural/blob/main/ATIVIDADE_Semana_5_Implementa%C3%A7%C3%A3o_de_uma_rede_neural_com_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ATIVIDADE: Implementação de uma rede neural com Python

* Leia o tutorial de Rede Neural usando Keras e Tensorflow (https://www.tensorflow.org/tutorials/keras/text_classification?hl=pt-br).

* Desenvolva seu código Python no Google Colab a partir do código apresentado no tutorial e organize as etapas com suas respectivas descrições.

* Exporte o modelo treinado usando a biblioteca pickle, e crie uma função que recebe um novo dado e o modelo treinado, e retorna o resultado da classificação realizada.

* Desafio: realize adaptações no seu código para realizar a classificação binária de "recomendação para um amigo" do dataset da B2W (https://github.com/americanas-tech/b2w-reviews01/blob/main/B2W-Reviews01.csv).

## Instalação de bibliotecas

In [None]:
import tensorflow as tf
from tensorflow import keras

import numpy as np
import pickle

## Base de dados
Utilização da bibliotela Keras para carregar um conjunto de dados que será utilizado para o processamento para análise de sentimento

In [None]:
imdb = keras.datasets.imdb

(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)

## Mapeamento de palavras
Nesta etapa são atribuídos os índices às palavras do conjunto de dados, permitindo a utilização em modelos de machine learning para processamento de linguagem natural

In [None]:
word_index = imdb.get_word_index()

word_index = {k:(v+3) for k,v in word_index.items()}
word_index["<PAD>"] = 0
word_index["<START>"] = 1
word_index["<UNK>"] = 2
word_index["<UNUSED>"] = 3

reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])

## Separação dos dados em treino e teste

In [None]:
train_data = keras.preprocessing.sequence.pad_sequences(train_data,
                                                        value=word_index["<PAD>"],
                                                        padding='post',
                                                        maxlen=256)

test_data = keras.preprocessing.sequence.pad_sequences(test_data,
                                                       value=word_index["<PAD>"],
                                                       padding='post',
                                                       maxlen=256)

## Modelagem
Modelo de classificação de análise de sentimento, mapeando em vetores de incoporação.

In [None]:
vocab_size = 10000

model = keras.Sequential()
model.add(keras.layers.Embedding(vocab_size, 16))
model.add(keras.layers.GlobalAveragePooling1D())
model.add(keras.layers.Dense(16, activation='relu'))
model.add(keras.layers.Dense(1, activation='sigmoid'))

model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding (Embedding)       (None, None, 16)          160000    
                                                                 
 global_average_pooling1d (G  (None, 16)               0         
 lobalAveragePooling1D)                                          
                                                                 
 dense (Dense)               (None, 16)                272       
                                                                 
 dense_1 (Dense)             (None, 1)                 17        
                                                                 
Total params: 160,289
Trainable params: 160,289
Non-trainable params: 0
_________________________________________________________________


## Exportando modelo em Pickle

In [None]:
with open('modelo.pickle', 'wb') as arquivo:
    pickle.dump(model, arquivo)

In [None]:
def classify_new_data(new_data, model_path):
    with open(model_path, 'rb') as arquivo:
        model = pickle.load(arquivo)

    new_data = keras.preprocessing.sequence.pad_sequences([new_data],
                                                          value=word_index["<PAD>"],
                                                          padding='post',
                                                          maxlen=256)
    prediction = model.predict(new_data)
    return prediction[0][0]

In [None]:
new_data = [3, 89, 12, 7, 128, 45, 90]
model_path = 'modelo.pickle'

classification_result = classify_new_data(new_data, model_path)
print(f"Resultado da classificação: {classification_result}")

Resultado da classificação: 0.5005006790161133
