<a href="https://colab.research.google.com/github/CarolineAndradeR/Data-Science/blob/main/Deep_Learning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Conceitos**

**Linguagem natural e análise de sentimentos**

Modelos de aprendizado profundo (Deep Learning) - Processamento de texto por meio da utilização de algoritmos de redes neurais recorrentes RNN, o processamento de texto tem aplixações em diversas problemáticas da vida real, entre elas:
*   Classificação de documentos - análise de grandes volumes de processos jurpidicos para classificação de parecer e sentença.
*   Comparação de documentos - avaliação de textos para detecção de cópias e plágios.
*   Tradutor de idioma - indentificação de contextos no encadeamento de palavras para traduzir de um idioma para outro.
*   Análise/ classificação de sentimentos em comentários de redes sociais.
*   Criação de textos, criação de novos textos com base no padrão de escrita de um autor usado para criação de matérias de revistas e editoriais.



O aprensizado profundo, ou **Deep Learning**, é uma subárea do aprendizado em máquina ML baseado em algoritmos que utilizam redes neurais artificiais (RNA)

O RNA pode ser dividido em três etapas:
1.   O modelo recebe um conjunto de sinais (X) como entrada.
2.   Cada sinal é multiplicado por um número que pondera a influência desse sinal na saída da unidade. (Podemos chamar o conjunto desses números de pesos (W)).
3.   É realizada uma soma ponderada de todos os sinais, produzindo um número (valor escalar).
4.   Se o resultado for maior que um limiar, a unidade produz um valor resultante determinado.


Uma rede neural é um conjunto de neurônios organizados em camadas, formando a Rede Multi Layer Perceptron (MLP). Os neurônios processam os dados de entrada e propagam a saída para outras camadas. A MLP possui uma camada de entrada, uma de saída e uma ou mais camadas ocultas. As camadas ocultas são densamente conectadas, com os neurônios de uma camada servindo de entrada para a próxima.

Deep está relacionado ao número de camadas ocultas que existem na rede neural, quanto mais camada, mais deeo é a rede neural. Rede neurais modernas possuem facilmente mais de dez camadas ocultas, no caso de Deeo Learning é um framework (TensorFlow) utilizado para treinamento e representação de aprendizados por meio de dados (textos).

O uso da técina de Deeo Learning é muito vasto e pode ser usado em vários problemas da ciência de dados, incluino classificação, regressão, aprendizao por reforço, redução de dimensionalidade, clusterização e análise de sentimentos.

**RNN - Redes neurais recorrentes**

São uma técnica de deep learning muito empregada em aplicações de processamento de linguagem natural (NLP) em que os dados são processados sequencialmente, resultando em uma análise aprimorada de conjunto de dados complexos, por meio da modelagem em séries temporais dos dados de entrada.

A extração da informação não parte apenas dos dados, mas também da forma que é apresentada. A informação é entendida por uma sequência de palavras, ou seja, nãp descartamos as palavras anteriores ao ler novas palavras, nós compreendemos a nova palavra a partir das anteriores, essa é a característica da memória.

**Diferença entre Rede neural recorrente e rede neural artificial**

A diferença principal entre ela é que a saída de uma RNN retroalimenta a entrada do próprio neurônio. A saída atual do neurônio ocorre por meio da função de ativação das entradas atuais multiplicadas pelos seus pesos somados á saída anterior multiplicada pele seu peso.

**Arquiteturas de redes RNN LSTM e GRU**

Na prática, uma RNN não possui capacidade de capturar informações de muitas etapas anteriores, devido á grande complexidade desse processamento, um problama conhecido como explosão de gradiente, por isso as redes LSTM são muito utilizadas.

**Long Short Term Memory LSTM** - é um tipo de rede recorrente muito utilizada em tarefas de processamento de linguagem natural. Essa rede é útil para classificar e prever séries temporais com intervalos de tempo e duração desconhecidos. Basicamente, trata-se de uma RNN que computa os estados ocultos de forma um pouco diferente, possui uma estrutura em cadeia que contem quatro redes neurais e diferentes blocos de memória chamados células.

**GRU** - é uma solução para memória de curto prazo e possui portões para regular o floxo de informação, porém, uma diferença é a quantidade de gate comparada com LSTM.

# **Aplicação de RNN LSTM e GRU**

Aplicando os conceitos de LSTM e GRU para treinar um conjunto de dados de comentários de filmes para classificar se a review foi positiva ou negativa. A predição desse modelo é entendida como positiva se os valores de saída forem maiores que 0 e negativa caso contrário. Dessa forma podemos facilmente predizer novas reviews, classificando como positiva ou negativa automaticamente.

**Alterar o ambiente de execução para GPU para acelerar o aprendizando, faz com que o algoritmo treine de forma mais rápida, porque é usado processamento paralelizado**

In [8]:
import numpy as np
# Base de dados de exemplo da propria tensorflow
import tensorflow_datasets as tfds
import tensorflow as tf

BUFFER_SIZE = 10000
BATCH_SIZE = 64
VOCAB_SIZE=1000

# Baixando e carregando a base de dados
dataset, info = tfds.load('imdb_reviews', with_info=True, as_supervised=True)
train_dataset, test_dataset = dataset['train'], dataset['test']

In [9]:
# Dividindo e embaralhando os dados
train_dataset = train_dataset.shuffle(BUFFER_SIZE).batch(BATCH_SIZE).prefetch(tf.data.AUTOTUNE)
test_dataset = test_dataset.batch(BATCH_SIZE).prefetch(tf.data.AUTOTUNE)

# Realizando o pre-processamento, convertendo palavras para números
# Dado de entrada é do tipo texto, e o encoder ele transforma palavras em números
encoder = tf.keras.layers.experimental.preprocessing.TextVectorization(
    max_tokens=VOCAB_SIZE)
encoder.adapt(train_dataset.map(lambda text, label: text))

In [11]:
# Criação do modelo para a rede neural
# Esse modelo é o mais simples para redes
model = tf.keras.Sequential([
    encoder,
    tf.keras.layers.Embedding(
        input_dim=len(encoder.get_vocabulary()),
        output_dim=64, mask_zero=True),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64)),
    # Rede densa, com 64 saídas, reduz esses passos para um único neuronio especialista
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(1)
])
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 text_vectorization_6 (TextV  (None, None)             0         
 ectorization)                                                   
                                                                 
 embedding_1 (Embedding)     (None, None, 64)          64000     
                                                                 
 bidirectional_1 (Bidirectio  (None, 128)              66048     
 nal)                                                            
                                                                 
 dense_2 (Dense)             (None, 64)                8256      
                                                                 
 dense_3 (Dense)             (None, 1)                 65        
                                                                 
Total params: 138,369
Trainable params: 138,369
Non-tr

In [None]:
# Compilando o model
# Escolha das metricas que vão ser utilizadas
model.compile(loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              optimizer=tf.keras.optimizers.Adam(1e-4),
              metrics=['accuracy'])
# Treinando o modelo
history = model.fit(train_dataset, epochs=10,
                    validation_data=test_dataset,
                    validation_steps=30)
# Validando o modelo
test_loss, test_acc = model.evaluate(test_dataset)
print('Test Loss: {}'.format(test_loss))
print('Test Accuracy: {}'.format(test_acc))
# Realizando uma predição
sample_text = ('The movie was cool. The animation and the graphics '
              'were out of this world. I would recommend this movie.')
predictions = model.predict(np.array([sample_text]))
print(predictions)

Downloading and preparing dataset 80.23 MiB (download: 80.23 MiB, generated: Unknown size, total: 80.23 MiB) to /root/tensorflow_datasets/imdb_reviews/plain_text/1.0.0...


Dl Completed...: 0 url [00:00, ? url/s]

Dl Size...: 0 MiB [00:00, ? MiB/s]

Generating splits...:   0%|          | 0/3 [00:00<?, ? splits/s]

Generating train examples...:   0%|          | 0/25000 [00:00<?, ? examples/s]

Shuffling /root/tensorflow_datasets/imdb_reviews/plain_text/1.0.0.incompleteN528HH/imdb_reviews-train.tfrecord…

Generating test examples...:   0%|          | 0/25000 [00:00<?, ? examples/s]

Shuffling /root/tensorflow_datasets/imdb_reviews/plain_text/1.0.0.incompleteN528HH/imdb_reviews-test.tfrecord*…

Generating unsupervised examples...:   0%|          | 0/50000 [00:00<?, ? examples/s]

Shuffling /root/tensorflow_datasets/imdb_reviews/plain_text/1.0.0.incompleteN528HH/imdb_reviews-unsupervised.t…

Dataset imdb_reviews downloaded and prepared to /root/tensorflow_datasets/imdb_reviews/plain_text/1.0.0. Subsequent calls will reuse this data.
Epoch 1/10
Epoch 2/10
Epoch 3/10