<a href="https://colab.research.google.com/github/garciiabrd/DVCml/blob/main/ed07dvc.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

1. Instalação das Bibliotecas Necessárias

In [None]:
!pip install dvc
!pip install scikit-learn

2. Código do Scriptevaluate.py

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report
import joblib

In [None]:
df= pd.read_csv('/content/drive/MyDrive/Dados/iris.csv')
df.head()

In [None]:
# Separar as características e o alvo
X = df.drop('variety', axis=1)
y = df['variety']

In [None]:
# Dividir os dados em conjunto de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
# Treinar o modelo (caso ainda não tenha feito)
model = DecisionTreeClassifier(random_state=42)
model.fit(X_train, y_train)

In [None]:
# Salva o modelo treinado
joblib.dump(model, 'model.pkl')

In [None]:
# Carregar o modelo treinado
model = joblib.load('model.pkl')

In [None]:
# Fazer previsões
y_pred = model.predict(X_test)

In [None]:
# Avaliar as métricas
accuracy = accuracy_score(y_test, y_pred)
report = classification_report(y_test, y_pred)

In [None]:
# Salvar as métricas em um arquivo
with open('metrics.txt', 'w') as f:
    f.write(f'Accuracy: {accuracy}\n\n')
    f.write('Classification Report:\n')
    f.write(report)

print("Avaliação concluída. Métricas salvas em metrics.txt.")

3. Adicionar o Script ao DVC

In [None]:
!dvc run -n evaluate_model \
    -d evaluate.py -d model.pkl -d iris.csv \
    -o metrics.txt \
    python evaluate.py

4. Rodar a Avaliação

In [None]:
# Instalar Git (se necessário, mas normalmente já está disponível no Colab)
!apt-get install git

In [None]:
# Passo 1: Configurar o Git
!apt-get install git
!git config --global user.name "garciiabrd"
!git config --global user.email "brendagarcia09200@gmail.com"

In [None]:
# Passo 2: Clonar o repositório
!git clone https://github.com/garciiabrd/DVCml.git
%cd DVCml

In [None]:
# Passo 3: Inicializar o DVC
!dvc init

In [None]:
# Passo 4: Adicionar o script ao DVC
!dvc stage add -n evaluate_model \
    -d evaluate.py -d model.pkl -d iris.csv \
    -o metrics.txt \
    python evaluate.py

In [None]:
#Listar arquivos para verificar a estrutura
!ls -la

In [None]:
#Adicionar o estágio ao DVC, ajustando o caminho conforme necessário
!dvc stage add -n evaluate_model --force \
    -d evaluate.py -d model.pkl -d iris.csv \
    -o metrics.txt \
    python evaluate.py


In [None]:
#Passo 5: Rodar o pipeline para gerar metrics.txt
!dvc repro

In [None]:
#Passo 6: Adicionar e fazer commit dos arquivos
!git add .gitignore dvc.yaml metrics.txt.dvc
!git commit -m "Add evaluation metrics"

In [None]:
#Passo 7: Enviar para o GitHub
!git push origin main