# **Cultura e Pr√°ticas em DataOps e MLOps**


- Por Daniel: realizando teste rodando este c√≥digo a partir de um ambiente Conda personalizado fornecido pelo professor da cadeira. Hoje √© segunda-feira 2025-11-17. Est√° instalado no meu Notebook Dell Alienware, de nome Antyliah, um banco de dados SQLite para dar suporte √† biblioteca MLflow.

**Autor Professor**: Renan Santos Mendes
**Email do PROFESSOR**: renansantosmendes@gmail.com

**Descri√ß√£o**: Este notebook apresenta um exemplo de uma rede neural profunda com mais de uma camada para um problema de classifica√ß√£o.


# **Sa√∫de Fetal**

As Cardiotocografias (CTGs) s√£o op√ß√µes simples e de baixo custo para avaliar a sa√∫de fetal, permitindo que os profissionais de sa√∫de atuem na preven√ß√£o da mortalidade infantil e materna. O pr√≥prio equipamento funciona enviando pulsos de ultrassom e lendo sua resposta, lan√ßando luz sobre a frequ√™ncia card√≠aca fetal (FCF), movimentos fetais, contra√ß√µes uterinas e muito mais.

Este conjunto de dados cont√©m 2126 registros de caracter√≠sticas extra√≠das de exames de Cardiotocografias, que foram ent√£o classificados por tr√™s obstetras especialistas em 3 classes:

- Normal
- Suspeito
- Patol√≥gico

# 1 - Importando os m√≥dulos necess√°rios

In [1]:
# Estou rodando copiando o texto original do professor para um novo projeto com o PyCharm.
import os
import random
import numpy as np
import random as python_random
import tensorflow
import tensorflow as tf
from tensorflow import keras
from keras.models import Sequential
from keras.layers import Dense, InputLayer
from keras.utils import to_categorical

import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

# Definindo fun√ß√µes adicionais

In [2]:
# Esta fun√ß√£o definida no Python ir√° inserir seeds propositais de n√∫mero 42 em todas as fun√ß√µes que utilizam randomiza√ß√£o.
# H√° desde fun√ß√µes de ambiente operacional at√© as bibliotecas espec√≠ficas.
def reset_seeds() -> None:
  """
  Resets the seeds to ensure reproducibility of results.

  This function sets the seed for various random number generation libraries
  to ensure that results are reproducible. The affected libraries are:
  - Python's built-in `random`
  - NumPy
  - TensorFlow

  The seed used is 42.

  Returns:
      None
  """
  os.environ['PYTHONHASHSEED']=str(42)
  tf.random.set_seed(42)
  np.random.seed(42)
  random.seed(42)

# 2 - Fazendo a leitura do dataset e atribuindo √†s respectivas vari√°veis

In [3]:
# Aqui, de maneira interessante, o professor referencia a vari√°vei data carregando dados que est√£o na Web em seu site.
# A biblioteca utilizada para isso √© a Pandas com a fun√ß√£o read_csv. Data ser√° um objeto pandas.core.frame.DataFrame.
url = 'raw.githubusercontent.com'
username = 'renansantosmendes'
repository = 'lectures-cdas-2023'
file_name = 'fetal_health_reduced.csv'
data = pd.read_csv(f'https://{url}/{username}/{repository}/master/{file_name}')

# Dando uma leve olhada nos dados:

In [4]:
data.head(30)

Unnamed: 0,severe_decelerations,accelerations,fetal_movement,uterine_contractions,fetal_health
0,0.0,0.0,0.0,0.0,2.0
1,0.0,6.0,0.0,6.0,1.0
2,0.0,3.0,0.0,8.0,1.0
3,0.0,3.0,0.0,8.0,1.0
4,0.0,7.0,0.0,8.0,1.0
5,0.0,1.0,0.0,10.0,3.0
6,0.0,1.0,0.0,13.0,3.0
7,0.0,0.0,0.0,0.0,3.0
8,0.0,0.0,0.0,2.0,3.0
9,0.0,0.0,0.0,3.0,3.0


# 3 - Preparando o dado antes de iniciar o treino do modelo

In [5]:
# Atribuir a X o dataframe data sem a coluna fetal_health. Isto mant√©m apenas as vari√°veis preditoras de features em X.
# Em uma √∫nica linha fazemos a atribui√ß√£o a X de uma vers√£o de data com o drop da coluna fetal_health.
# Interessante √© que na verdade drop √© um m√©todo de data!
X=data.drop(["fetal_health"], axis=1)

# Aqui fazemos o complemento: atribu√≠mos a y as vari√°veis alvo da coluna fetal_health. Para isto, acessamos especificamente
# de data a coluna fetal_health referenciando-a entre colchetes com o nome fetal_health entre aspas.
y=data["fetal_health"]

# Guardar os nomes das colunas para posterior processamento. Interessante mostrar que se retiram as colunas de X, ou seja,
# s√≥ haver√° as colunas dos features, e n√£o da vari√°vel preditora fetal_health.
columns_names = list(X.columns)

# Criando um objeto para pr√©-processamento dos dados.A classe StandardScaler pertence √† scikit-learn.
# Ela padroniza dados, transformando cada feature para que tenha M√©dia = 0 e Desvio Padr√£o = 1. Esta transforma√ß√£o
# serve para algoritmos de machine learning, como regress√£o log√≠stica, SVM e Redes Neurais.
scaler = preprocessing.StandardScaler()

# Usando o objeto scaler para transformar os valores de X:
X_df = scaler.fit_transform(X)

# Reconstruindo um Datagrame Pandas com os dados padronizados, juntando com os nomes originais das colunas, que deixamos
# guardados em columns_names anteriormente:
X_df = pd.DataFrame(X_df, columns=columns_names)

# Abaixo, cl√°ssica instru√ß√£o de divis√£o de features e vari√°veis preditoras em conjuntos de treino e de teste utilizando
# train_test_split, com 30% para teste. A atribui√ß√£o de 42 ao atributo de entrada random_state permite refazer o teste
# tendo o mesmo resultado de distribui√ß√£o aleat√≥ria do conjunto de dados de teste, permitindo rastrear e repetir o passo caso
# necess√°rio tendo os mesmos resultados de treinamento e teste. X_df √© o resultado do processamento feito para permitir
# o treinamento. Recomenda-se comparar os dois objetos, X e X_df.
X_train, X_test, y_train, y_test = train_test_split(X_df,
                                                    y,
                                                    test_size=0.3,
                                                    random_state=42)

# Isto aqui √© curioso: subtrai-se 1 das vari√°veis preditoras de treinamento e de teste, provavelmente para ajustar r√≥tulos que
# possuem sa√≠das de predi√ß√£o iniciados em 1 para poderem iniciar em zero, mas fica mais claro olhando os resultados depois.
y_train = y_train -1
y_test = y_test - 1

# 4 - Criando o modelo e adicionando camadas

In [6]:
# Cria√ß√£o de camadas de rede neural artificial

# A instru√ß√£o abaixo chama a fun√ß√£o criada antes que opera
# em todas as partes do c√≥digo e do ambiente que porventura
# fa√ßam uso de randomiza√ß√£o para que os passos de separa√ß√µes
# ou escolhas aleat√≥rias sejam repetidos. Lembrando a fun√ß√£o:
#  os.environ['PYTHONHASHSEED']=str(42): - Define a semente do hash aleat√≥rio usado internamente pelo Python
#  tf.random.set_seed(42): Define a semente para o gerador de n√∫meros aleat√≥rios do TensorFlow.
#  np.random.seed(42): Define a semente para o gerador de n√∫meros aleat√≥rios do NumPy.
#  random.seed(42): Define a semente para o m√≥dulo random da biblioteca padr√£o do Python.
reset_seeds()

# Aqui define-se uma rede neural sequencial usando a biblioteca Keras.
# Para constar, a importa√ß√£o foi feita assim:
# from tensorflow import keras
# from keras.models import Sequential
# from keras.layers import Dense, InputLayer
# from keras.utils import to_categorical

# Criando um modelo Sequential, que √© uma pilha linear de camadas.
# Cada camada tem exatamente uma entrada e uma sa√≠da???????
model = Sequential()

# Definindo a forma de entrada da rede;
# input_shape = (X_train.shape[1],) significa que a entrada ser√° um vetor com
# o mesmo n√∫mero de colunas (features) que o conjunto de treino X_train.
# Esta camada n√£o possui neur√¥nios de ativa√ß√£o. A fun√ß√£o dele √©
# estabelecer para a rede neural o formado de entrada dos dados.
#model.add(InputLayer(input_shape=(X_train.shape[1], )))
model.add(InputLayer(shape=(X_train.shape[1], )))

# Adiciona a primeira camada oculta no modo Dense que √© totalmente conectada.
# Especifica que esta camada possui 10 neur√¥nios e que usar√° a fun√ß√£o de
# ativa√ß√£o ReLU - Rectified Linear Unit, que introduz n√£o linearidade e ajuda
# a rede a aprender padr√µes complexos.
model.add(Dense(units=10, activation='relu'))

# Adiciona mais uma camada oculta igual √† anterior:
model.add(Dense(units=10, activation='relu'))

# Finalmente, adicionando uma camada final de 3 neur√¥nios que representa os 3
# poss√≠veis estados da vari√°vel alvo fetal_health. A fun√ß√£o de ativa√ß√£o softmax
# transforma as sa√≠das em probabilidades que somam 1, o que √© ideal para a
# classifica√ß√£o multiclasse.
model.add(Dense(units=3, activation='softmax'))

# 5 - Compilando o modelo

In [7]:
# Configurando o modelo de rede neural para treinamento utilizando o m√©todo compile():

# - loss = 'sparse_categorical_cossentropy': define a fun√ß√£o de perda (loss function) a qual mede o erro entre as previs√µes
# e os r√≥tulos reais. a fun√ß√£o de perda escolhida, sparse_categorical_crossentropy √© usada para classifica√ß√£o multiclasse
# quando os r√≥tulos s√£o inteiros, tais como 0, 1, 2 e n√£o vetores # one-hot.

# - optimizer = 'adam': Define o otimizador, que ajusta os pesos da rede para minimizar a fun√ß√£o de perda. Adam - Adaptive
# Moment Estimation √© um dos otimizadores mais populares.

# - metrics = ['accuraccy']: define a m√©trica de avalia√ß√£o usada durante o treinamento e valida√ß√£o. accuracy = (n√∫mero de
# acertos)/(total de exemplos).

model.compile(loss='sparse_categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

# Configurando o MLflow

In [8]:
# Aqui tinha muita coisa pessoal do Professor Renan. Depois adaptei para rodar localmente.
# Para isso, antes de rodar o c√≥digo, lembrar de digitar 'mlflow ui' em um prompt de comando para ativar a home page
# que vai apresentar os resultados da biblioteca MLflow.
import mlflow

#os.environ['MLFLOW_TRACKING_USERNAME'] = 'renansantosmendes'
#os.environ['MLFLOW_TRACKING_PASSWORD'] = '6d730ef4a90b1caf28fbb01e5748f0874fda6077'
#mlflow.set_tracking_uri('https://dagshub.com/renansantosmendes/puc_lectures_mlops.mlflow')
mlflow.set_tracking_uri("http://localhost:5000") # Vai usar o banco de dados SWLite e o MLflow no meu pr√≥pro computador.

mlflow.keras.autolog(log_models=True,
                     log_input_examples=True,
                     log_model_signatures=True)



# 6 - Executando o treino do modelo

In [9]:
# Iniciando experimento MLflow com o nome 'experiment_mlops_ead.
# Tudo o que acontece dentro do bloco 'with' ser√° registrado automaticamente
# pelo MLflow. No caso, ser√£o par√¢metros do modelo, m√©tricas de desempenho
# e os artefatos, que no caso √© o modelo treinado. O objeto 'run' representa
# a execu√ß√£o atual, permitindo aceso a informa√ß√µes como ID, status e
# resultados.

with mlflow.start_run(run_name='experiment_mlops_ead') as run:
  model.fit(X_train,
            y_train,
            epochs=50,
            validation_split=0.2,
            verbose=3)



Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
üèÉ View run experiment_mlops_ead at: http://localhost:5000/#/experiments/0/runs/ec03f64445384d35a83b08d69b4a5885
üß™ View experiment at: http://localhost:5000/#/experiments/0


In [10]:
# Funcionou tudo. Agora √© descobrir como utilizar o artefato.