In [67]:
import pandas as pd
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
from keras.utils import to_categorical

import tensorflow as tf
import os

os.environ['CUDA_VISIBLE_DEVICES'] = '-1'

In [68]:

# carregar dados do arquivo CSV
df = pd.read_csv('dataset/mnist_train.csv')

# extrair coluna de rótulos (labels)
y = df['label'].values

# extrair colunas de pixels e convertê-los em arrays de imagem
x = df.iloc[:, 1:].values.reshape(df.shape[0], 28, 28, 1)

# normalizar valores dos pixels para [0,1]
x = x.astype('float32')
x /= 255

# converter rótulos em vetores de classes binárias
y = to_categorical(y, 10)


In [69]:

# definir modelo
model = Sequential()

# primeira camada convolucional com 32 filtros de tamanho 3x3
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))

# segunda camada convolucional com 64 filtros de tamanho 3x3
model.add(Conv2D(64, (3, 3), activation='relu'))

# camada de max pooling com tamanho de janela 2x2
model.add(MaxPooling2D((2, 2)))

# camada de dropout para evitar overfitting
model.add(Dropout(0.25))

# camada de achatamento para converter a saída em um vetor 1D
model.add(Flatten())

# camada densa com 128 neurônios e função de ativação ReLU
model.add(Dense(128, activation='relu'))

# camada de dropout para evitar overfitting
model.add(Dropout(0.5))

# camada de saída com 10 neurônios (1 para cada dígito)
# e função de ativação softmax para obter uma distribuição de probabilidade
model.add(Dense(10, activation='softmax'))

# compilar modelo com função de perda categorical cross-entropy,
# otimizador Adam e métrica de acurácia
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

In [70]:

# compilar modelo
model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])


In [17]:

# treinar modelo
model.fit(x, y,
          batch_size=128,
          epochs=10,
          verbose=1,
          validation_split=0.2)

# salvar modelo treinado
model.save('mnist_model.h5')

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [71]:
from tensorflow.keras.models import load_model

# carregar dados de teste do arquivo CSV
df_test = pd.read_csv('dataset/mnist_test.csv')

# extrair colunas de pixels e remover a primeira coluna de rótulos
x_test = df_test.iloc[:, 1:].values

# normalizar valores dos pixels para [0,1] e redimensionar para o formato esperado pelo modelo
x_test = x_test.astype('float32') / 255
x_test = x_test.reshape(-1, 28, 28, 1)

# carregar modelo treinado
model = load_model('mnist_model.h5')

# extrair coluna de rótulos e converter para array numpy
y_test = df_test.iloc[:, 0].values

# avaliar modelo nos dados de teste
y_pred = model.predict(x_test)
y_pred = np.argmax(y_pred, axis=1)

# imprimir acurácia
acc = np.mean(y_pred == y_test)
print('Test accuracy:', acc)

Test accuracy: 0.9907


In [77]:
import cv2
import matplotlib.pyplot as plt

def recortar_numeros(imagem):
    # Carregar a imagem
    img = cv2.imread(imagem)

    # Converter a imagem para escala de cinza
    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # Binarizar a imagem usando um valor de limiar adequado
    _, img_thresh = cv2.threshold(img_gray, 200, 255, cv2.THRESH_BINARY_INV)

    # Encontrar contornos dos objetos na imagem binarizada
    contours, _ = cv2.findContours(img_thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # Criar uma lista para armazenar as informações dos contornos
    contornos = []

    # Iterar sobre os contornos encontrados
    for contour in contours:
        # Obter o retângulo delimitador do contorno
        (x, y, w, h) = cv2.boundingRect(contour)

        # Adicionar as informações do contorno à lista
        contornos.append((x, y, w, h))

    # Ordenar os contornos com base na coordenada x
    contornos = sorted(contornos, key=lambda c: c[0])

    # Criar uma lista para armazenar as imagens recortadas dos números
    numeros_recortados = []

    # Recortar os números da imagem original na ordem correta
    for (x, y, w, h) in contornos:
        numero_recortado = img[y:y+h, x:x+w]
        numero_redimensionado = cv2.resize(numero_recortado, (28, 28))
        numeros_recortados.append(numero_redimensionado)

    return numeros_recortados

# Caminho da imagem com os números
# caminho_imagem = 'numeros_manuscrito.jpg'
caminho_imagem = 'numeros.jpeg'

# Chamar a função para recortar os números da imagem
numeros_recortados = recortar_numeros(caminho_imagem)

# Exibir os números recortados usando matplotlib
fig = plt.figure()

# Preprocessar as imagens recortadas e fazer as previsões com o modelo
previsoes = []
for numero in numeros_recortados:
    numero = cv2.cvtColor(numero, cv2.COLOR_BGR2GRAY)
    numero = numero.astype('float32') / 255
    numero = np.expand_dims(numero, axis=-1)
    numero = np.expand_dims(numero, axis=0)
    previsao = model.predict(numero)
    previsao = np.argmax(previsao)
    previsoes.append(previsao)

# Imprimir as previsões
print('Previsões:', previsoes)

# Exibir as imagens recortadas
fig, axs = plt.subplots(1, len(numeros_recortados), figsize=(10, 2))
for i, numero in enumerate(numeros_recortados):
    axs[i].imshow(cv2.cvtColor(numero, cv2.COLOR_BGR2RGB))
    axs[i].set_title('p[i]: {}'.format(previsoes[i]))
    axs[i].axis('off')
plt.show()

# for i, numero_recortado in enumerate(numeros_recortados):
#     ax = fig.add_subplot(1, len(numeros_recortados), i+1)
#     ax.imshow(cv2.cvtColor(numero_recortado, cv2.COLOR_BGR2RGB))
#     ax.axis('off')

plt.show()

[ WARN:0@7688.511] global loadsave.cpp:244 findDecoder imread_('numeros.jepg'): can't open/read file: check file path/integrity


error: OpenCV(4.7.0) /io/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'
