In [1]:
import pandas as pd
from sklearn.tree import DecisionTreeClassifier, export_graphviz
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import accuracy_score
import graphviz # Necessário para visualizar a árvore

# 1. Preparar os Dados
# Criando um DataFrame com nossos dados de exemplo
data = {
    'Tempo': ['Ensolarado', 'Ensolarado', 'Nublado', 'Chuvoso', 'Chuvoso', 'Chuvoso', 'Nublado', 'Ensolarado', 'Ensolarado', 'Chuvoso'],
    'Temperatura': ['Quente', 'Quente', 'Quente', 'Agradavel', 'Fria', 'Fria', 'Fria', 'Agradavel', 'Fria', 'Agradavel'],
    'Umidade': ['Alta', 'Alta', 'Alta', 'Alta', 'Normal', 'Normal', 'Normal', 'Alta', 'Normal', 'Normal'],
    'Vento': ['Fraco', 'Forte', 'Fraco', 'Fraco', 'Fraco', 'Forte', 'Forte', 'Fraco', 'Fraco', 'Forte'],
    'Sair_Caminhar': ['Nao', 'Nao', 'Sim', 'Sim', 'Sim', 'Nao', 'Sim', 'Nao', 'Sim', 'Sim']
}
df = pd.DataFrame(data)

print("Dados originais:")
print(df)
print("\n" + "="*30 + "\n")

# Codificando as variáveis categóricas para numéricas
# Usaremos LabelEncoder para simplificar neste exemplo
le = LabelEncoder()

for column in ['Tempo', 'Temperatura', 'Umidade', 'Vento', 'Sair_Caminhar']:
    df[column] = le.fit_transform(df[column])

# Mapeamento para entender as codificações (opcional, mas útil)
# O fit_transform atribui números em ordem alfabética ou de aparição
# Ex: 'Chuvoso': 0, 'Ensolarado': 1, 'Nublado': 2
# Ex: 'Nao': 0, 'Sim': 1
print("Dados após codificação Label Encoding:")
print(df)
print("\n" + "="*30 + "\n")

# Separando features (X) e target (y)
X = df[['Tempo', 'Temperatura', 'Umidade', 'Vento']]
y = df['Sair_Caminhar']

# Nomes das features para visualização
feature_names = X.columns.tolist()
# Nomes das classes para visualização (0='Nao', 1='Sim')
class_names = ['Nao', 'Sim']

# 2. Dividir os Dados (vamos usar todos os dados para treinamento neste exemplo bem pequeno)
# Em um cenário real, você dividiria em X_train, X_test, y_train, y_test
# Para este exemplo minúsculo, usaremos todos os dados para treinar e demonstrar a árvore
X_train, X_test, y_train, y_test = X, X, y, y # Apenas para manter a estrutura, mas não é o ideal para avaliação real

# 3. Criar e Treinar a Árvore de Decisão
# min_samples_leaf=1: Cada nó folha deve ter pelo menos 1 amostra.
# random_state: Para garantir que os resultados sejam reproduzíveis.
model = DecisionTreeClassifier(random_state=42, min_samples_leaf=1)
model.fit(X_train, y_train)

print("Modelo de Árvore de Decisão treinado com sucesso!")
print("\n" + "="*30 + "\n")

# 4. Avaliar o Modelo (para este exemplo, a precisão será 100% pois treinamos e testamos com os mesmos dados)
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do modelo nos dados de 'teste' (que são os de treino neste caso): {accuracy:.2f}")
print("\n" + "="*30 + "\n")

# 5. Visualizar a Árvore de Decisão
dot_data = export_graphviz(
    model,
    out_file=None,
    feature_names=feature_names,
    class_names=class_names,
    filled=True,      # Colore os nós
    rounded=True,     # Bordas arredondadas
    special_characters=True
)

graph = graphviz.Source(dot_data)
graph.render("arvore_de_decisao_caminhada", view=True, format='png') # Salva como PNG e abre

print("Árvore de Decisão visualizada e salva como 'arvore_de_decisao_caminhada.png'.")
print("Ela deve ter aberto automaticamente, caso contrário, procure pelo arquivo.")

# Exemplo de Previsão para um novo ponto de dados
# O que aconteceria se: Tempo=Nublado (2), Temperatura=Agradavel (0), Umidade=Normal (1), Vento=Fraco (0)
# Lembre-se que 'Sim' é 1 e 'Não' é 0
novo_dado = pd.DataFrame([[2, 0, 1, 0]], columns=feature_names) # Exemplo: Nublado, Agradavel, Normal, Fraco
predicao = model.predict(novo_dado)

# Mapear de volta para o texto original
predicao_texto = "Sim" if predicao[0] == 1 else "Nao"

print(f"\nPrevisão para Tempo=Nublado, Temperatura=Agradavel, Umidade=Normal, Vento=Fraco: {predicao_texto}")

ModuleNotFoundError: No module named 'graphviz'

In [2]:
conda install graphviz

Channels:
 - defaults
Platform: win-64
Collecting package metadata (repodata.json): ...working... done
Solving environment: ...working... done

## Package Plan ##

  environment location: C:\Users\N5\miniconda3\envs\KNN-TEST

  added / updated specs:
    - graphviz


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    boost-cpp-1.82.0           |       h59b6b97_2          11 KB
    cairo-1.16.0               |       h85cdd14_6         1.9 MB
    font-ttf-dejavu-sans-mono-2.37|       hd3eb1b0_0         335 KB
    font-ttf-inconsolata-2.001 |       hcb22688_0          83 KB
    font-ttf-source-code-pro-2.030|       hd3eb1b0_0         654 KB
    font-ttf-ubuntu-0.83       |       h8b1ccd4_0         1.5 MB
    fontconfig-2.14.1          |       hb33846d_3         224 KB
    fonts-anaconda-1           |       h8fa9717_0           3 KB
    fonts-conda-ecosystem-1    |       hd3eb1b0_0           5 