## Tópicos Especiais em Inteligência Artificial
### Classificação de diagnostico de cancer de mama com Deep Neural Network (DNN)
### Instituto Federal de Minas Gerais - IFMG
### Aluno: César Nogueira Rodrigues

Neste trabalho vamos utilizar o dataset Breast Cancer Wisconsin

1. ID do paciente 
2. Espessura (1-10)
3. Uniformidade de tamanho da célula (1-10)
3. Uniformidade de forma da célula (1-10)
5. Adesão marginal (1-10)
6. Tamanho único epitelial da célula (1-10)
7. Quantidade de núcleos nus (1-10)
8. Cromatina (1-10)
9. Quantidade de nucleos normais (1-10)
10. Mitoses (1-10)
11. [SAIDA] Classificação (2 para indicar BENIGNO, 4 Para indicar MALIGNO)

O dataset contém 458 amostras com: 
- 65.5% de casos BENIGNO
- 34.5% de casos MALIGNO 

In [1]:
# função para deixar o jupyter com celulas preenchendo a tela toda

from IPython.display import display, HTML
display(HTML("<style>.container{width:100% !important;}</style>"))

In [6]:
#importação de bibliotecas 

# exportacao do requiriment.txt
import subprocess
import sys 

#  lib para dados e graficos
import pandas as pd
import numpy as np 
import matplotlib.pyplot as plt 
import seaborn as sns
from tabulate import tabulate

#bibliotecas do scikit-learn
from sklearn import preprocessing
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix

#biblioteca para exportacoes e importacoes de arquivos
from joblib import dump, load

#biblioteca para implementar uma barra de progresso
import progressbar

#biblioteca para tocar sons
import pygame

#bibliotecas para deep learning
import tensorflow as tf 
import tensorflow.keras
from tensorflow.keras.models import Model, load_model
from tensorflow.keras.layers import Input, LayerNormalization, BatchNormalization, Flatten, Dense, Reshape, Dropout

from tensorflow.keras.optimizers import Adam, Nadam
from tensorflow.keras.utils import plot_model
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
from tensorflow.keras.metrics import BinaryCrossentropy


import pydot as pyd
import pydotplus
from pydotplus import graphviz
from tensorflow.keras.utils import plot_model, model_to_dot
tensorflow.keras.utils.pydot = pyd


In [7]:
#checagem de GPU
import keras
print('tensorflow: ', tf.__version__)
print('Keras: ', keras.__version__)
print('GPU disponivel: ', len(tf.config.list_physical_devices('GPU')) > 0)
print('GPU(s): ', tf.config.list_physical_devices('GPU'))

tensorflow:  2.20.0
Keras:  3.12.0
GPU disponivel:  False
GPU(s):  []


In [8]:
#rotina para exportacao da lista de pacotes
def exportaRequirements():
    try:
        resultado = subprocess.run([sys.executable, '-m', 'pip', 'freeze'],
                                capture_output = True,
                                text = True,
                                check = True)
        with open('requirements.txt', 'w') as f:
            f.write(resultado.stdout)
        print('Arquivo exportado com sucesso!')
    except subprocess.CalledProcessError as e:
        print(f'Deu erro: {e}')
exportaRequirements()

Arquivo exportado com sucesso!


## 2. Importação do dataseet


In [10]:
col_names = ['ID','espessura','tam_celula','forma_celula',
             'adesao','tam_epitelial','nucleos_nus', 'cromatina',
             'nucleos_normais', 'mitoses', 'diagnostico']


# importação do dataset
data = pd.read_csv('dataset/breast-cancer-wisconsin.csv', header=None, names=col_names)

# remove a coluna ID pois ela nao sera usada para nada
data = data.drop('ID', axis=1)

# substitui '?' por NaN
data = data.replace('?', np.nan)

#converte tudo para numero 
data = data.astype(float)

# converte o codigo do diagnostico 
data = data.assign(diagnostico = data['diagnostico'].replace({2:0, 4:1}))

