<a href="https://colab.research.google.com/github/1moi6/pyfuzzy-toolbox/blob/main/notebooks_colab/Aula_4/01_anfis_iris_classificacao.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üß† ANFIS: Classifica√ß√£o de Flores Iris

**Aula 4 - Minicurso de Sistemas de Infer√™ncia Fuzzy**

---

## üìã Objetivo

Neste notebook, vamos aplicar **ANFIS (Adaptive Neuro-Fuzzy Inference System)** para classificar flores Iris.

### O que √© ANFIS?

ANFIS combina:
- üß© **L√≥gica Fuzzy**: Regras interpret√°veis
- üß† **Redes Neurais**: Aprendizado autom√°tico (backpropagation)

### Vantagens sobre Wang-Mendel:
- ‚úÖ **Refina** as fun√ß√µes de pertin√™ncia (MFs)
- ‚úÖ **Otimiza** par√¢metros (n√£o apenas gera regras)
- ‚úÖ **Adapta-se** aos dados via gradient descent

---

## üìö Refer√™ncias
- Jang, J. S. (1993). "ANFIS: adaptive-network-based fuzzy inference system." *IEEE transactions on systems, man, and cybernetics*, 23(3), 665-685.
- Fisher, R. A. (1936). "The use of multiple measurements in taxonomic problems."

---

## üîß Instala√ß√£o

In [None]:
!pip install pyfuzzy-toolbox[ml] scikit-learn -q

print('‚úÖ pyfuzzy-toolbox e scikit-learn instalados com sucesso!')

## üì¶ Importa√ß√µes

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import fuzzy_systems as fs
from fuzzy_systems.learning import ANFIS
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
import pandas as pd

%matplotlib inline

# Configura√ß√µes
plt.rcParams['figure.figsize'] = (12, 6)
sns.set_palette('husl')
np.random.seed(42)

print('‚úÖ Bibliotecas importadas!')
print(f'   pyfuzzy-toolbox: {fs.__version__}')

## üìä Passo 1: Carregar e Explorar Dataset Iris

In [None]:
# Carregar dataset
iris = load_iris()
X_full = iris.data
y_full = iris.target

# Criar DataFrame para facilitar visualiza√ß√£o
df = pd.DataFrame(X_full, columns=iris.feature_names)
df['species'] = iris.target_names[y_full]

print('üìä Dataset Iris carregado!')
print(f'\nShape: {X_full.shape}')
print(f'\nClasses: {iris.target_names}')
print(f'\nFeatures: {iris.feature_names}')
print('\nPrimeiras 5 amostras:')
df.head()

## üìà Visualizar Distribui√ß√£o das Features

In [None]:
# Visualizar distribui√ß√£o das features
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
axes = axes.flatten()

for idx, feature in enumerate(iris.feature_names):
    for species_id, species_name in enumerate(iris.target_names):
        data = df[df['species'] == species_name][feature]
        axes[idx].hist(data, alpha=0.6, bins=15, label=species_name)
    
    axes[idx].set_xlabel(feature, fontsize=11)
    axes[idx].set_ylabel('Frequ√™ncia', fontsize=11)
    axes[idx].set_title(f'Distribui√ß√£o: {feature}', fontsize=12, weight='bold')
    axes[idx].legend()
    axes[idx].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print('‚úÖ Visualiza√ß√£o criada!')

## üéØ Passo 2: Preparar Dados - Classifica√ß√£o Bin√°ria (2 Features)

Vamos come√ßar com um problema **mais simples**:
- Usar apenas **2 features**: Petal Length e Petal Width
- **Classifica√ß√£o bin√°ria**: Setosa vs N√£o-Setosa

**Por qu√™?** Setosa √© linearmente separ√°vel das outras esp√©cies!

In [None]:
# Selecionar apenas as features da p√©tala (colunas 2 e 3)
X_2d = X_full[:, 2:4]  # petal length e petal width

# Criar labels bin√°rios: Setosa (0) vs Outras (1)
y_binary = (y_full != 0).astype(int)  # 0 = Setosa, 1 = N√£o-Setosa

print('Features selecionadas:')
print(f'  - {iris.feature_names[2]}')
print(f'  - {iris.feature_names[3]}')
print(f'\nDistribui√ß√£o das classes:')
print(f'  Setosa:     {np.sum(y_binary == 0)} amostras')
print(f'  N√£o-Setosa: {np.sum(y_binary == 1)} amostras')

## üìà Visualizar Separabilidade

In [None]:
# Visualizar separabilidade
fig, ax = plt.subplots(figsize=(10, 8))

colors = ['red', 'blue']
labels = ['Setosa', 'N√£o-Setosa']

for class_id in [0, 1]:
    mask = y_binary == class_id
    ax.scatter(X_2d[mask, 0], X_2d[mask, 1], 
              c=colors[class_id], label=labels[class_id],
              s=80, alpha=0.7, edgecolors='black', linewidth=1)

ax.set_xlabel(iris.feature_names[2] + ' (cm)', fontsize=13)
ax.set_ylabel(iris.feature_names[3] + ' (cm)', fontsize=13)
ax.set_title('Iris Dataset - 2 Features (P√©tala)', fontsize=15, weight='bold')
ax.legend(fontsize=12)
ax.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print('Note: Setosa √© claramente separ√°vel das outras classes!')

## üì¶ Passo 3: Dividir e Normalizar Dados

In [None]:
# Dividir dados: 70% treino, 15% valida√ß√£o, 15% teste
X_train_2d, X_temp_2d, y_train_2d, y_temp_2d = train_test_split(
    X_2d, y_binary, test_size=0.3, random_state=42, stratify=y_binary
)

X_val_2d, X_test_2d, y_val_2d, y_test_2d = train_test_split(
    X_temp_2d, y_temp_2d, test_size=0.5, random_state=42, stratify=y_temp_2d
)

print(f'Conjunto de treino:    {len(X_train_2d)} amostras')
print(f'Conjunto de valida√ß√£o: {len(X_val_2d)} amostras')
print(f'Conjunto de teste:     {len(X_test_2d)} amostras')

# Normalizar dados
scaler_2d = StandardScaler()
X_train_2d_norm = scaler_2d.fit_transform(X_train_2d)
X_val_2d_norm = scaler_2d.transform(X_val_2d)
X_test_2d_norm = scaler_2d.transform(X_test_2d)

print('\n‚úÖ Dados normalizados!')
print(f'\nRanges ap√≥s normaliza√ß√£o:')
print(f'  Feature 1: [{X_train_2d_norm[:, 0].min():.2f}, {X_train_2d_norm[:, 0].max():.2f}]')
print(f'  Feature 2: [{X_train_2d_norm[:, 1].min():.2f}, {X_train_2d_norm[:, 1].max():.2f}]')

## üß† Passo 4: Criar e Treinar Modelo ANFIS

### Arquitetura ANFIS:

- **2 entradas** (petal_length, petal_width)
- **3 MFs** por entrada ‚Üí 3¬≤ = **9 regras**
- **Regulariza√ß√£o L2** para evitar overfitting
- **Learning rate**: 1e-3

In [None]:
# Criar modelo ANFIS
anfis_2d = ANFIS(
    n_inputs=2,
    n_mfs=3,
    learning_rate=1e-3,
    lambda_l2=0.01,  # Regulariza√ß√£o L2
    classification=True
)

print('‚úÖ Modelo ANFIS criado!')
print(f'\nüìä Arquitetura:')
print(f'   ‚Ä¢ Entradas: 2')
print(f'   ‚Ä¢ MFs por entrada: 3')
print(f'   ‚Ä¢ Total de regras: 9')
print(f'   ‚Ä¢ Learning rate: 0.001')
print(f'   ‚Ä¢ Regulariza√ß√£o: L2 (Œª=0.01)')

## üèãÔ∏è Treinar ANFIS

In [None]:
# Treinar
print('Iniciando treinamento...\n')

anfis_2d.fit(
    X_train_2d_norm, y_train_2d,
    epochs=200,
    validation_data=(X_val_2d_norm, y_val_2d),
    early_stopping_patience=30,
    verbose=True
)

print('\n' + '='*60)
print('‚úÖ Treinamento conclu√≠do!')
print('='*60)

## üìà Visualizar Converg√™ncia

In [None]:
# Plotar curvas de aprendizado
history = anfis_2d.history

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 5))

# Loss
ax1.plot(history['loss'], 'b-', linewidth=2, label='Treino', alpha=0.8)
ax1.plot(history['val_loss'], 'r--', linewidth=2, label='Valida√ß√£o', alpha=0.8)
ax1.set_xlabel('√âpoca', fontsize=12)
ax1.set_ylabel('Loss', fontsize=12)
ax1.set_title('Converg√™ncia - Loss', fontsize=14, weight='bold')
ax1.legend(fontsize=11)
ax1.grid(True, alpha=0.3)

# Accuracy
ax2.plot(history['accuracy'], 'b-', linewidth=2, label='Treino', alpha=0.8)
ax2.plot(history['val_accuracy'], 'r--', linewidth=2, label='Valida√ß√£o', alpha=0.8)
ax2.set_xlabel('√âpoca', fontsize=12)
ax2.set_ylabel('Acur√°cia', fontsize=12)
ax2.set_title('Converg√™ncia - Acur√°cia', fontsize=14, weight='bold')
ax2.legend(fontsize=11)
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print('‚úÖ Curvas de aprendizado geradas!')

## üéØ Passo 5: Avaliar Desempenho

In [None]:
# Predi√ß√µes
y_train_pred_2d = anfis_2d.predict(X_train_2d_norm)
y_val_pred_2d = anfis_2d.predict(X_val_2d_norm)
y_test_pred_2d = anfis_2d.predict(X_test_2d_norm)

# Acur√°cias
acc_train_2d = accuracy_score(y_train_2d, y_train_pred_2d)
acc_val_2d = accuracy_score(y_val_2d, y_val_pred_2d)
acc_test_2d = accuracy_score(y_test_2d, y_test_pred_2d)

print('='*70)
print('üìä RESULTADOS - CLASSIFICA√á√ÉO BIN√ÅRIA (2 FEATURES)')
print('='*70)
print(f'Acur√°cia Treino:    {acc_train_2d*100:6.2f}%')
print(f'Acur√°cia Valida√ß√£o: {acc_val_2d*100:6.2f}%')
print(f'Acur√°cia Teste:     {acc_test_2d*100:6.2f}%')
print('='*70)

## üìä Matriz de Confus√£o

In [None]:
# Matriz de confus√£o
cm_test_2d = confusion_matrix(y_test_2d, y_test_pred_2d)

fig, ax = plt.subplots(figsize=(8, 6))
sns.heatmap(cm_test_2d, annot=True, fmt='d', cmap='Blues', ax=ax,
            xticklabels=['Setosa', 'N√£o-Setosa'],
            yticklabels=['Setosa', 'N√£o-Setosa'],
            cbar_kws={'label': 'Contagem'})
ax.set_xlabel('Predito', fontsize=13)
ax.set_ylabel('Real', fontsize=13)
ax.set_title(f'Matriz de Confus√£o - Teste\nAcur√°cia: {acc_test_2d*100:.2f}%',
            fontsize=14, weight='bold')
plt.tight_layout()
plt.show()

# Relat√≥rio detalhado
print('\nüìã RELAT√ìRIO DE CLASSIFICA√á√ÉO - CONJUNTO DE TESTE')
print('='*70)
print(classification_report(y_test_2d, y_test_pred_2d,
                           target_names=['Setosa', 'N√£o-Setosa'],
                           digits=4))

## üó∫Ô∏è Visualizar Fronteira de Decis√£o

In [None]:
# Criar grid para a superf√≠cie de decis√£o
x1_min, x1_max = X_train_2d_norm[:, 0].min() - 0.5, X_train_2d_norm[:, 0].max() + 0.5
x2_min, x2_max = X_train_2d_norm[:, 1].min() - 0.5, X_train_2d_norm[:, 1].max() + 0.5

xx1, xx2 = np.meshgrid(np.linspace(x1_min, x1_max, 200),
                       np.linspace(x2_min, x2_max, 200))

# Fazer predi√ß√µes no grid
print('Gerando superf√≠cie de decis√£o...')
Z = anfis_2d.predict(np.c_[xx1.ravel(), xx2.ravel()]).reshape(xx1.shape)
print('Superf√≠cie gerada!')

# Plotar fronteira de decis√£o
fig, ax = plt.subplots(figsize=(12, 10))

# Superf√≠cie
contour = ax.contourf(xx1, xx2, Z, levels=[0, 0.5, 1],
                      colors=['#ffcccc', '#ccccff'], alpha=0.6)

# Contorno da fronteira
ax.contour(xx1, xx2, Z, levels=[0.5], colors='black',
           linewidths=3, linestyles='solid')

# Pontos com indica√ß√£o de erro
corretos = y_test_2d == y_test_pred_2d
incorretos = ~corretos

ax.scatter(X_test_2d_norm[corretos, 0], X_test_2d_norm[corretos, 1],
           c='green', marker='o', s=100, label='Correto',
           edgecolors='black', linewidth=1.5, alpha=0.8)
ax.scatter(X_test_2d_norm[incorretos, 0], X_test_2d_norm[incorretos, 1],
           c='orange', marker='X', s=150, label='Erro',
           edgecolors='red', linewidth=2, alpha=0.9)

ax.set_xlabel('Comprimento da P√©tala (normalizado)', fontsize=12)
ax.set_ylabel('Largura da P√©tala (normalizado)', fontsize=12)
ax.set_title(f'Fronteira de Decis√£o ANFIS\nErros: {np.sum(incorretos)}/{len(y_test_2d)}',
             fontsize=14, weight='bold')
ax.legend(fontsize=11)
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

---

## üéì Conclus√µes

### ‚úÖ O que aprendemos?

1. **ANFIS combina o melhor de dois mundos**:
   - **Fuzzy**: Regras interpret√°veis
   - **Neural**: Aprendizado autom√°tico via backpropagation

2. **Vantagens sobre Wang-Mendel**:
   - Wang-Mendel: Gera regras, MFs fixas
   - ANFIS: **Refina** MFs e consequentes via gradient descent

3. **Regulariza√ß√£o √© importante**:
   - L2 (Ridge) evita overfitting
   - Especialmente √∫til com poucas amostras

4. **Trade-offs**:
   - ANFIS: Mais par√¢metros, mais flex√≠vel, treino mais lento
   - Wang-Mendel: Menos par√¢metros, mais r√°pido, menos flex√≠vel

---

### üî¨ ANFIS vs Wang-Mendel

| Aspecto | Wang-Mendel | ANFIS |
|---------|-------------|-------|
| Gera√ß√£o de regras | Autom√°tica (1 passo) | Inicializa√ß√£o + refinamento |
| Fun√ß√µes de pertin√™ncia | Fixas | **Aprendidas** |
| Consequentes | Fixos | **Otimizados** |
| Tempo de treino | R√°pido | Mais lento |
| Flexibilidade | Menor | **Maior** |
| Interpretabilidade | Alta | Alta (se MFs n√£o mudam muito) |

---

### üöÄ Pr√≥ximos Passos

1. **Experimentar com 4 features** (todas as vari√°veis do Iris)
2. **Testar diferentes valores de regulariza√ß√£o** (Œª)
3. **Comparar com outros m√©todos** (SVM, Random Forest)
4. **Aplicar a outros datasets** de classifica√ß√£o

---

### üìö Recursos

- **PyPI**: https://pypi.org/project/pyfuzzy-toolbox/
- **GitHub**: https://github.com/1moi6/pyfuzzy-toolbox

### üìñ Refer√™ncias

1. **Jang, J. S. (1993)**. "ANFIS: adaptive-network-based fuzzy inference system." *IEEE transactions on systems, man, and cybernetics*, 23(3), 665-685.

2. **Fisher, R. A. (1936)**. "The use of multiple measurements in taxonomic problems." *Annals of Eugenics*, 7(2), 179-188.

---

**üéâ Parab√©ns! Voc√™ aplicou ANFIS para classifica√ß√£o!**

*Notebook desenvolvido para o Minicurso de Sistemas de Infer√™ncia Fuzzy - Aula 4 - 2025*  
*Usando pyfuzzy-toolbox v1.0.0*