In [1]:
import sys
print(f"Python version: {sys.version}")
print(f"Python executable: {sys.executable}")


Python version: 3.9.23 (main, Jun  3 2025, 18:47:52) 
[Clang 17.0.0 (clang-1700.0.13.3)]
Python executable: /Users/marcelosilva/Desktop/Hands-on Machine Learning/.venv/bin/python


In [2]:
# Verificando bibliotecas principais
import warnings
warnings.filterwarnings('ignore')

libraries = {
    'NumPy': 'numpy',
    'Pandas': 'pandas', 
    'Matplotlib': 'matplotlib',
    'Seaborn': 'seaborn',
    'Scikit-learn': 'sklearn',
    'TensorFlow': 'tensorflow',
    'Keras': 'keras'
}

print("📦 Verificando bibliotecas instaladas:")
print("=" * 50)

for name, module in libraries.items():
    try:
        lib = __import__(module)
        version = getattr(lib, '__version__', 'N/A')
        print(f"✅ {name:<15} versão: {version}")
    except ImportError:
        print(f"❌ {name:<15} não instalado")

print("\n" + "=" * 50)


📦 Verificando bibliotecas instaladas:
✅ NumPy           versão: 2.0.2
✅ Pandas          versão: 2.3.0+4.g1dfc98e16a
✅ Matplotlib      versão: 3.9.4
✅ Seaborn         versão: 0.13.2
✅ Scikit-learn    versão: 1.6.1
✅ TensorFlow      versão: 2.19.0
✅ Keras           versão: 3.10.0



In [3]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

# Configuração do matplotlib
plt.style.use('default')
plt.rcParams['figure.figsize'] = (10, 6)
sns.set_palette("husl")

print("🎯 Bibliotecas importadas com sucesso!")


🎯 Bibliotecas importadas com sucesso!


In [4]:
# Criando dataset sintético
X, y = make_classification(
    n_samples=1000,
    n_features=20,
    n_informative=15,
    n_redundant=5,
    n_classes=3,
    random_state=42
)

print(f"Dataset criado com {X.shape[0]} amostras e {X.shape[1]} features")
print(f"Classes: {np.unique(y)}")
print(f"Distribuição das classes: {np.bincount(y)}")

# Dividindo dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

print(f"\nConjunto de treino: {X_train.shape[0]} amostras")
print(f"Conjunto de teste: {X_test.shape[0]} amostras")


Dataset criado com 1000 amostras e 20 features
Classes: [0 1 2]
Distribuição das classes: [333 331 336]

Conjunto de treino: 800 amostras
Conjunto de teste: 200 amostras


In [5]:
# Treinando modelo Random Forest
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
rf_model.fit(X_train, y_train)

# Fazendo predições
y_pred = rf_model.predict(X_test)

# Avaliando o modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"🎯 Modelo Random Forest treinado com sucesso!")
print(f"Acurácia no conjunto de teste: {accuracy:.4f}")

# Relatório de classificação
print("\n📊 Relatório de Classificação:")
print("=" * 50)
print(classification_report(y_test, y_pred))


🎯 Modelo Random Forest treinado com sucesso!
Acurácia no conjunto de teste: 0.7850

📊 Relatório de Classificação:
              precision    recall  f1-score   support

           0       0.78      0.73      0.75        67
           1       0.77      0.86      0.81        66
           2       0.81      0.76      0.78        67

    accuracy                           0.79       200
   macro avg       0.79      0.79      0.78       200
weighted avg       0.79      0.79      0.78       200

