# Redes Neurais Convolucionais

## Convolução

A convolução é um conceito fundamental em processamento de sinais e análise de imagens, frequentemente usado em áreas como processamento de imagem, visão computacional e aprendizado de máquina. É uma operação matemática que combina dois conjuntos de dados para produzir um terceiro conjunto de dados, geralmente representando uma mistura ou sobreposição das informações nos conjuntos originais. Em processamento de imagens, a convolução é usada para aplicar filtros ou máscaras a uma imagem para realizar tarefas como detecção de bordas, suavização ou realce de características. No contexto de aprendizado de máquina, a convolução é uma parte fundamental das redes neurais convolucionais (CNNs), que são amplamente utilizadas para tarefas de visão computacional, como classificação de imagens e detecção de objetos.

## Diferença entre uma CNN e uma RNA tradicional 
Redes neurais e redes neurais convolucionais (CNNs) são ambas estruturas de aprendizado de máquina que consistem em várias camadas de neurônios artificiais interconectados. No entanto, elas têm diferentes arquiteturas e são projetadas para lidar com tipos diferentes de dados e tarefas. Aqui estão algumas das principais diferenças entre as duas:

### Arquitetura e Conectividade:

Redes Neurais (RNs): As redes neurais tradicionais, também conhecidas como perceptrons multicamadas, consistem em camadas de neurônios interconectados. Cada neurônio em uma camada está conectado a todos os neurônios da camada anterior e da próxima camada.
Redes Neurais Convolucionais (CNNs): As CNNs foram projetadas especificamente para processar dados de grade, como imagens. Elas incluem camadas de convolução que aplicam operações de convolução a regiões locais das entradas, permitindo a detecção de padrões locais. Além disso, as camadas de pooling são usadas para reduzir a dimensionalidade da representação e capturar características invariantes a pequenas traduções.
Processamento de Dados:

RNs: Embora as redes neurais possam ser usadas para uma variedade de tarefas, como classificação de texto e séries temporais, elas não são otimizadas para dados com estrutura espacial, como imagens.
CNNs: As CNNs são especialmente adequadas para tarefas de visão computacional devido à sua capacidade de explorar a estrutura espacial das imagens. Elas usam filtros convolucionais para detectar padrões como bordas, texturas e formas em diferentes regiões da imagem.
Parâmetros Compartilhados:

RNs: Em redes neurais tradicionais, cada neurônio em uma camada está conectado a todos os neurônios da camada anterior, resultando em muitos parâmetros treináveis.
CNNs: Nas camadas de convolução das CNNs, os filtros são compartilhados em várias regiões da entrada. Isso reduz significativamente o número de parâmetros e permite que as CNNs capturem eficientemente características locais em diferentes partes da imagem.
Invariância Espacial:

RNs: Redes neurais tradicionais não são projetadas para lidar explicitamente com a invariância espacial, o que é importante em tarefas de visão computacional.
CNNs: Devido à aplicação de convoluções e camadas de pooling, as CNNs são capazes de aprender características que são invariantes a pequenas variações de posição na imagem.
Aplicações:

RNs: São usadas para uma ampla gama de tarefas, incluindo processamento de linguagem natural, análise de séries temporais e outras tarefas que não envolvem explicitamente dados de grade.
CNNs: São especialmente adequadas para tarefas de visão computacional, como classificação de imagens, detecção de objetos, segmentação semântica e muito mais.
Em resumo, as redes neurais convolucionais (CNNs) foram projetadas especificamente para lidar com dados de grade, como imagens, e são altamente eficazes em tarefas de visão computacional devido à sua capacidade de capturar informações espaciais e hierárquicas nas imagens. Por outro lado, redes neurais tradicionais (RNs) são mais versáteis e podem ser usadas para uma variedade de tarefas de aprendizado de máquina, incluindo processamento de linguagem natural e análise de séries temporais.

## Como são as CNNs


Uma Convolutional Neural Network (CNN), é uma arquitetura especializada em processamento de imagens e dados com estrutura espacial. Ela consiste em várias camadas que operam de maneira hierárquica para extrair características relevantes de uma imagem e, em seguida, usá-las para realizar tarefas como classificação, detecção de objetos, segmentação, entre outras. Abaixo está uma explicação passo a passo de como uma CNN é construída:

### 1. Camada de Entrada

A entrada para a CNN é a imagem que você deseja processar. Uma imagem é uma matriz tridimensional de pixels, onde as dimensões são largura, altura e canais de cor (como vermelho, verde e azul em uma imagem RGB).

### 2. Camadas de Convolução

As camadas de convolução são o cerne de uma CNN. Cada camada consiste em vários filtros (também chamados de kernels) que deslizam pela imagem para realizar a operação de convolução. Esses filtros são responsáveis por detectar padrões e características específicas, como bordas, texturas e formas. À medida que os filtros são aplicados, eles produzem mapas de características que representam a presença dessas características na imagem.

### 3. Camadas de Ativação

Após a operação de convolução, é comum aplicar uma função de ativação, como a função ReLU (Rectified Linear Activation), para introduzir não-linearidade nas saídas das camadas. Isso permite que a rede aprenda relações mais complexas entre as características.

### 4. Camadas de Pooling

As camadas de pooling são usadas para reduzir a dimensionalidade da representação, diminuindo a quantidade de cálculos necessários e tornando a rede mais eficiente. O pooling mais comum é o Max Pooling, onde apenas o valor máximo em uma região é mantido, descartando os outros valores. Isso também ajuda a tornar a rede mais robusta a pequenas variações na posição dos objetos na imagem.

### 5. Camadas Totalmente Conectadas

Após passar por várias camadas de convolução e pooling, os mapas de características resultantes são achatados em um vetor unidimensional e alimentados em camadas totalmente conectadas, semelhantes às camadas em redes neurais tradicionais. Essas camadas finais da CNN combinam as informações aprendidas das características em uma representação que pode ser usada para a tarefa específica, como classificação ou detecção.

### 6. Camada de Saída

A camada de saída produz a saída final da rede, que pode variar de acordo com a tarefa. Por exemplo, em uma tarefa de classificação, pode ser um vetor de probabilidades associadas a diferentes classes. Em detecção de objetos, pode ser um conjunto de caixas delimitadoras e as classes correspondentes.

### 7. Treinamento

A CNN é treinada usando um algoritmo de otimização, como o gradiente descendente, para ajustar os pesos das conexões entre os neurônios. O treinamento é feito comparando as previsões da rede com os rótulos verdadeiros e ajustando os pesos para minimizar o erro.

### 8. Camadas de Regularização e Normalização

Camadas adicionais, como a camada de dropout para regularização e a camada de normalização por lotes, podem ser adicionadas para melhorar o desempenho e a generalização da rede.

Em resumo, uma CNN é construída usando camadas de convolução, ativação, pooling e totalmente conectadas, com o objetivo de extrair e combinar características em uma hierarquia para tarefas de processamento de imagens. A arquitetura exata e o número de camadas dependem da complexidade da tarefa e da natureza dos dados.


In [2]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout


In [5]:
import os
import shutil
import tempfile

def prepare_directories(data_dir, target_dir):
    # Crie um diretório temporário para consolidar os dados
    temp_dir = tempfile.mkdtemp()
    
    # Copie as pastas de classes para o diretório temporário
    classes = ['cats', 'dogs', 'panda']
    for class_name in classes:
        source_path = os.path.join(data_dir, class_name)
        target_path = os.path.join(temp_dir, class_name)
        shutil.copytree(source_path, target_path)
    
    # Copie os dados do diretório temporário para o diretório alvo
    shutil.rmtree(target_dir, ignore_errors=True)
    shutil.move(temp_dir, target_dir)
home_dir = os.path.expanduser("~")
# Defina o caminho absoluto para a pasta contendo as imagens
data_dir = os.path.join(home_dir, 'UnB/CIS/animals')

target_dir = os.path.join(home_dir, 'UnB/CIS/teste')

# Prepare os diretórios
prepare_directories(data_dir, target_dir)

In [7]:
# Defina os parâmetros
image_size = (224, 224)
batch_size = 10
epochs = 10

# Crie um gerador de dados
datagen = ImageDataGenerator(
    rescale=1.0/255,
    validation_split=0.2
)

# Carregue os dados de treinamento e validação
train_generator = datagen.flow_from_directory(
    target_dir,
    target_size=image_size,
    batch_size=batch_size,
    class_mode='categorical',
    subset='training'
)

Found 2400 images belonging to 3 classes.


In [8]:
validation_generator = datagen.flow_from_directory(
    target_dir,
    target_size=image_size,
    batch_size=batch_size,
    class_mode='categorical',
    subset='validation'
)

# Crie o modelo da rede convolucional
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)),
    MaxPooling2D(2, 2),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D(2, 2),
    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D(2, 2),
    Flatten(),
    Dense(512, activation='relu'),
    Dropout(0.5),
    Dense(3, activation='softmax')
])

# Compile o modelo
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])


Found 600 images belonging to 3 classes.


In [9]:
# Treine o modelo
history = model.fit(train_generator, epochs=epochs, validation_data=validation_generator)


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [10]:
#model.save('modelo_treinado.h5')

# Salve também o histórico de treinamento em um arquivo JSON
import json
history_dict = history.history
with open('history.json', 'w') as json_file:
    json.dump(history_dict, json_file)

  saving_api.save_model(


In [9]:
import json
from tensorflow.keras.models import load_model

# Carregue o modelo treinado
loaded_model = load_model('modelo_treinado.h5')

# Leia o histórico de treinamento de volta
with open('history.json', 'r') as json_file:
    loaded_history_dict = json.load(json_file)


In [10]:
model.summary()#parametros do modelo


Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 222, 222, 32)      896       
                                                                 
 max_pooling2d (MaxPooling2  (None, 111, 111, 32)      0         
 D)                                                              
                                                                 
 conv2d_1 (Conv2D)           (None, 109, 109, 64)      18496     
                                                                 
 max_pooling2d_1 (MaxPoolin  (None, 54, 54, 64)        0         
 g2D)                                                            
                                                                 
 conv2d_2 (Conv2D)           (None, 52, 52, 128)       73856     
                                                                 
 max_pooling2d_2 (MaxPoolin  (None, 26, 26, 128)       0

In [11]:
from tensorflow.keras.applications import VGG16

# Carregue o modelo pré-treinado VGG16 (sem as camadas fully connected no topo)
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# Congele as camadas do modelo base
for layer in base_model.layers:
    layer.trainable = False

# Crie o modelo completo
model_transfer = Sequential([
    base_model,
    Flatten(),
    Dense(512, activation='relu'),
    Dropout(0.5),
    Dense(3, activation='softmax')
])

# Compile o modelo
model_transfer.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Treine o modelo
history_transfer = model_transfer.fit(train_generator, epochs=epochs, validation_data=validation_generator)


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [5]:
import pandas as pd
import spacy
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer

In [19]:
# Carregando a base de dados
data = pd.read_csv("amazon.csv")

print(data.columns)

Index(['reviewerID', 'asin', 'reviewerName', 'helpful', 'reviewText',
       'overall', 'summary', 'unixReviewTime', 'reviewTime'],
      dtype='object')


In [2]:
import pandas as pd
import re
from nltk.corpus import stopwords
from nltk.stem import WordNetLemmatizer
from sklearn.feature_extraction.text import TfidfVectorizer
import spacy

# Load SpaCy's English tokenizer and language model
nlp = spacy.load("en_core_web_sm")
stop_words = set(stopwords.words('english'))
df = pd.read_csv("amazon.csv")
def prepare_text_spacy(text):
    text = text.replace(".", ". ").replace("!", ". ")
    text = re.sub(r'[^a-zA-z\s]','',text) # remove special characters
    text = " ".join([word.text.lower() for word in nlp(text) if word.text.lower() not in stop_words])
    lemmatizer = WordNetLemmatizer()
    text = " ".join([lemmatizer.lemmatize(token) for token in text.split()])
    return text

df["cleaned_text_spacy"] = df["Text"].apply(prepare_text_spacy)
df = df[df["cleaned_text_spacy"]!=""] # remove empty text

X_spacy = df["cleaned_text_spacy"]
y = df["overall"]

# Vectorization using TF-IDF
vectorizer = TfidfVectorizer(ngram_range=(1, 2))
X_tfidf_spacy = vectorizer.fit_transform(X_spacy)

print(X_tfidf_spacy.shape)


KeyError: 'Text'

In [7]:
# Carregar o modelo do SpaCy para processamento de texto
nlp = spacy.load("en_core_web_sm")

# Download dos stopwords do NLTK
nltk.download("stopwords")
stop_words = set(stopwords.words("english"))

def preprocess_text(text):
    # Lowercasing
    text = text.lower()
    
    # Remover pontuações usando RegEx
    text = re.sub(r"[^\w\s]", "", text)
    
    # Tokenização e lemmatização usando SpaCy
    doc = nlp(text)
    tokens = [token.lemma_ for token in doc]
    
    # Remover stopwords
    tokens = [token for token in tokens if token not in stop_words]
    
    # Juntar os tokens novamente em um texto processado
    processed_text = " ".join(tokens)
    
    return processed_text


[nltk_data] Downloading package stopwords to /home/jose/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [8]:
def tokenize_with_bow(texts):
    vectorizer = CountVectorizer()
    bow_matrix = vectorizer.fit_transform(texts)
    return bow_matrix, vectorizer

def tokenize_with_tfidf(texts):
    vectorizer = TfidfVectorizer()
    tfidf_matrix = vectorizer.fit_transform(texts)
    return tfidf_matrix, vectorizer


In [9]:
# Suponha que 'data' seja uma lista contendo seus textos de review
preprocessed_texts = [preprocess_text(text) for text in data]

# Tokenização usando BoW
bow_matrix, bow_vectorizer = tokenize_with_bow(preprocessed_texts)

# Tokenização usando TF-IDF
tfidf_matrix, tfidf_vectorizer = tokenize_with_tfidf(preprocessed_texts)


In [13]:
#import nltk
#nltk.download('punkt')
#nltk.download('stopwords')
#nltk.download('wordnet')
#################
################
#DEU CERTO
import re
import string
import nltk
from nltk.corpus import stopwords
from nltk.stem import WordNetLemmatizer
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
import pandas as pd

def preprocess_text(text):
    if isinstance(text, str):  # Verificar se é uma string
        # Converter para minúsculas
        text = text.lower()

        # Remover pontuações
        text = text.translate(str.maketrans('', '', string.punctuation))

        # Tokenização
        tokens = nltk.word_tokenize(text)

        # Remover stopwords
        tokens = [word for word in tokens if word not in stopwords.words('english')]

        # Lemmatization
        lemmatizer = WordNetLemmatizer()
        tokens = [lemmatizer.lemmatize(word) for word in tokens]

        # Reunir tokens em texto novamente
        preprocessed_text = ' '.join(tokens)
        return preprocessed_text
    else:
        return ""



# Aplicar pré-processamento e criar nova coluna
data['cleaned_reviewText'] = data['reviewText'].apply(preprocess_text)

# Criar matriz de features BOW
bow_vectorizer = CountVectorizer()
bow_features = bow_vectorizer.fit_transform(data['cleaned_reviewText'])

# Criar matriz de features TF-IDF
tfidf_vectorizer = TfidfVectorizer()
tfidf_features = tfidf_vectorizer.fit_transform(data['cleaned_reviewText'])


In [15]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# Suponha que 'data' contém o DataFrame com as colunas relevantes

# Dividir os dados em treinamento e teste
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)

# Usar vetorização BOW ou TF-IDF
vectorizer = CountVectorizer()  # Você pode alternar para TfidfVectorizer se desejar
X_train = vectorizer.fit_transform(train_data['cleaned_reviewText'])
X_test = vectorizer.transform(test_data['cleaned_reviewText'])

# Labels
y_train = train_data['overall']
y_test = test_data['overall']

# Treinar o classificador Naive Bayes
nb_classifier = MultinomialNB()
nb_classifier.fit(X_train, y_train)
nb_predictions = nb_classifier.predict(X_test)
nb_accuracy = accuracy_score(y_test, nb_predictions)
print("Naive Bayes Accuracy:", nb_accuracy)

# Treinar o classificador SVM
svm_classifier = SVC()
svm_classifier.fit(X_train, y_train)
svm_predictions = svm_classifier.predict(X_test)
svm_accuracy = accuracy_score(y_test, svm_predictions)
print("SVM Accuracy:", svm_accuracy)


Naive Bayes Accuracy: 0.6867998051631758
SVM Accuracy: 0.6829030686799805


In [16]:
import numpy as np
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Suponha que 'data' contém o DataFrame com as colunas relevantes

# Dividir os dados em treinamento e teste
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)

# Tokenização
tokenizer = Tokenizer()
tokenizer.fit_on_texts(train_data['cleaned_reviewText'])
X_train_sequences = tokenizer.texts_to_sequences(train_data['cleaned_reviewText'])
X_test_sequences = tokenizer.texts_to_sequences(test_data['cleaned_reviewText'])

# Padding
max_sequence_length = max(map(len, X_train_sequences))
X_train_padded = pad_sequences(X_train_sequences, maxlen=max_sequence_length, padding='post')
X_test_padded = pad_sequences(X_test_sequences, maxlen=max_sequence_length, padding='post')

# Labels
label_encoder = LabelEncoder()
label_encoder.fit(train_data['overall'])
y_train_encoded = label_encoder.transform(train_data['overall'])
y_test_encoded = label_encoder.transform(test_data['overall'])

# Criar o modelo RNN
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=len(tokenizer.word_index) + 1, output_dim=100, input_length=max_sequence_length),
    tf.keras.layers.SimpleRNN(64),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(len(label_encoder.classes_), activation='softmax')
])

# Compilar o modelo
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# Treinar o modelo
model.fit(X_train_padded, y_train_encoded, validation_data=(X_test_padded, y_test_encoded), epochs=5, batch_size=64)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7fd924075cf0>

In [17]:
import numpy as np
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Suponha que 'data' contém o DataFrame com as colunas relevantes

# Dividir os dados em treinamento e teste
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)

# Tokenização
tokenizer = Tokenizer()
tokenizer.fit_on_texts(train_data['cleaned_reviewText'])
X_train_sequences = tokenizer.texts_to_sequences(train_data['cleaned_reviewText'])
X_test_sequences = tokenizer.texts_to_sequences(test_data['cleaned_reviewText'])

# Padding
max_sequence_length = max(map(len, X_train_sequences))
X_train_padded = pad_sequences(X_train_sequences, maxlen=max_sequence_length, padding='post')
X_test_padded = pad_sequences(X_test_sequences, maxlen=max_sequence_length, padding='post')

# Labels
label_encoder = LabelEncoder()
label_encoder.fit(train_data['overall'])
y_train_encoded = label_encoder.transform(train_data['overall'])
y_test_encoded = label_encoder.transform(test_data['overall'])

# Criar o modelo LSTM unidirecional
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=len(tokenizer.word_index) + 1, output_dim=100, input_length=max_sequence_length),
    tf.keras.layers.LSTM(64),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(len(label_encoder.classes_), activation='softmax')
])

# Compilar o modelo
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# Treinar o modelo
model.fit(X_train_padded, y_train_encoded, validation_data=(X_test_padded, y_test_encoded), epochs=5, batch_size=64)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7fd92a090490>

In [18]:
import numpy as np
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

# Suponha que 'data' contém o DataFrame com as colunas relevantes

# Dividir os dados em treinamento e teste
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)

# Tokenização
tokenizer = Tokenizer()
tokenizer.fit_on_texts(train_data['cleaned_reviewText'])
X_train_sequences = tokenizer.texts_to_sequences(train_data['cleaned_reviewText'])
X_test_sequences = tokenizer.texts_to_sequences(test_data['cleaned_reviewText'])

# Padding
max_sequence_length = max(map(len, X_train_sequences))
X_train_padded = pad_sequences(X_train_sequences, maxlen=max_sequence_length, padding='post')
X_test_padded = pad_sequences(X_test_sequences, maxlen=max_sequence_length, padding='post')

# Labels
label_encoder = LabelEncoder()
label_encoder.fit(train_data['overall'])
y_train_encoded = label_encoder.transform(train_data['overall'])
y_test_encoded = label_encoder.transform(test_data['overall'])

# Criar o modelo LSTM bidirecional
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=len(tokenizer.word_index) + 1, output_dim=100, input_length=max_sequence_length),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64)),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(len(label_encoder.classes_), activation='softmax')
])

# Compilar o modelo
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# Treinar o modelo
model.fit(X_train_padded, y_train_encoded, validation_data=(X_test_padded, y_test_encoded), epochs=5, batch_size=64)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7fd916b373d0>