In [None]:
import numpy as np
from collections import Counter
import matplotlib.pyplot as plt

class NoDecisao:
    def __init__(self, caracteristica=None, limite=None, esquerda=None, 
                 direita=None, valor=None, ganho=None, n_amostras=None):
        self.valor = valor
        self.caracteristica = caracteristica
        self.limite = limite
        self.esquerda = esquerda
        self.direita = direita
        self.ganho = ganho  # Ganho de informa√ß√£o da divis√£o
        self.n_amostras = n_amostras  # N√∫mero de amostras no n√≥

class ArvoreDecisaoAprimorada:
    def __init__(self, profundidade_maxima=10, min_amostras_divisao=2, 
                 min_ganho_informacao=0.01, tipo='classificacao'):
        self.profundidade_maxima = profundidade_maxima
        self.min_amostras_divisao = min_amostras_divisao
        self.min_ganho_informacao = min_ganho_informacao
        self.tipo = tipo
        self.raiz = None
        self.importancias = None
    
    def ajustar(self, dados, rotulos):
        self.raiz = self._construir_arvore(dados, rotulos)
        self._calcular_importancias()
        return self
    
    # --- M√âTRICAS ---
    
    def _entropia(self, rotulos):
        if len(rotulos) == 0:
            return 0
        _, contagens = np.unique(rotulos, return_counts=True)
        probabilidades = contagens / len(rotulos)
        return -np.sum(probabilidades * np.log2(probabilidades + 1e-8))
    
    def _ganho_informacao(self, rotulos_pai, rotulos_esquerda, rotulos_direita):
        if len(rotulos_pai) == 0:
            return 0
        
        entropia_pai = self._entropia(rotulos_pai)
        peso_esquerda = len(rotulos_esquerda) / len(rotulos_pai)
        peso_direita = len(rotulos_direita) / len(rotulos_pai)
        
        entropia_filhos = (peso_esquerda * self._entropia(rotulos_esquerda) + 
                          peso_direita * self._entropia(rotulos_direita))
        
        return entropia_pai - entropia_filhos
    
    def _impureza_gini(self, rotulos):
        """Alternativa √† entropia - mais r√°pida computacionalmente"""
        if len(rotulos) == 0:
            return 0
        _, contagens = np.unique(rotulos, return_counts=True)
        probabilidades = contagens / len(rotulos)
        return 1 - np.sum(probabilidades ** 2)
    
    # --- DIVIS√ÉO ---
    
    def _melhor_divisao(self, dados, rotulos):
        melhor_ganho = -1
        melhor_caracteristica = None
        melhor_limite = None
        
        n_amostras, n_caracteristicas = dados.shape
        
        for idx_caracteristica in range(n_caracteristicas):
            caracteristica = dados[:, idx_caracteristica]
            
            # Amostragem inteligente de limites
            valores_unicos = np.unique(caracteristica)
            if len(valores_unicos) > 100:  # Para features com muitos valores √∫nicos
                percentis = np.linspace(0, 100, 50)
                limites_candidatos = np.percentile(caracteristica, percentis)
            else:
                limites_candidatos = valores_unicos
            
            for limite in limites_candidatos:
                mascara = caracteristica <= limite
                rotulos_esquerda = rotulos[mascara]
                rotulos_direita = rotulos[~mascara]
                
                if len(rotulos_esquerda) < self.min_amostras_divisao or \
                   len(rotulos_direita) < self.min_amostras_divisao:
                    continue
                
                ganho = self._ganho_informacao(rotulos, rotulos_esquerda, rotulos_direita)
                
                if ganho > melhor_ganho:
                    melhor_ganho = ganho
                    melhor_caracteristica = idx_caracteristica
                    melhor_limite = limite
        
        return melhor_caracteristica, melhor_limite, melhor_ganho
    
    def _valor_no(self, rotulos):
        if len(rotulos) == 0:
            return 0 if self.tipo == 'regressao' else None
        
        if self.tipo == 'classificacao':
            return Counter(rotulos).most_common(1)[0][0]
        else:  # regressao
            return np.mean(rotulos)
    
    def _construir_arvore(self, dados, rotulos, profundidade=0):
        n_amostras = len(rotulos)
        
        # Crit√©rios de parada
        if (profundidade >= self.profundidade_maxima or 
            n_amostras < self.min_amostras_divisao * 2 or
            len(np.unique(rotulos)) == 1):
            
            return NoDecisao(valor=self._valor_no(rotulos), n_amostras=n_amostras)
        
        # Encontrar melhor divis√£o
        caracteristica, limite, ganho = self._melhor_divisao(dados, rotulos)
        
        # Crit√©rio de ganho m√≠nimo
        if caracteristica is None or ganho < self.min_ganho_informacao:
            return NoDecisao(valor=self._valor_no(rotulos), n_amostras=n_amostras)
        
        # Aplicar divis√£o
        mascara = dados[:, caracteristica] <= limite
        esquerda = self._construir_arvore(dados[mascara], rotulos[mascara], profundidade + 1)
        direita = self._construir_arvore(dados[~mascara], rotulos[~mascara], profundidade + 1)
        
        return NoDecisao(caracteristica=caracteristica, limite=limite,
                        esquerda=esquerda, direita=direita, 
                        ganho=ganho, n_amostras=n_amostras)
    
    # --- FUNCIONALIDADES ---
    
    def _calcular_importancias(self):
        """Calcula import√¢ncia das features baseada no ganho de informa√ß√£o"""
        if self.raiz is None:
            return
        
        importancias = np.zeros(100)  # Assumindo at√© 100 features
        
        def _percorrer_arvore(no):
            if no.caracteristica is not None:
                # Import√¢ncia = ganho * propor√ß√£o de amostras
                importancia = no.ganho * (no.n_amostras / self.raiz.n_amostras)
                importancias[no.caracteristica] += importancia
                _percorrer_arvore(no.esquerda)
                _percorrer_arvore(no.direita)
        
        _percorrer_arvore(self.raiz)
        # Normalizar import√¢ncias
        soma_importancias = np.sum(importancias)
        if soma_importancias > 0:
            self.importancias = importancias / soma_importancias
    
    def obter_importancias(self, nomes_features=None):
        """Retorna import√¢ncia das features"""
        if self.importancias is None:
            return {}
        
        if nomes_features is None:
            nomes_features = [f'Feature_{i}' for i in range(len(self.importancias))]
        
        return dict(zip(nomes_features, self.importancias))
    
    def profundidade_arvore(self):
        """Calcula a profundidade real da √°rvore"""
        def _profundidade(no):
            if no.valor is not None:
                return 0
            return 1 + max(_profundidade(no.esquerda), _profundidade(no.direita))
        
        return _profundidade(self.raiz) if self.raiz else 0
    
    # --- PREVIS√ÉO ---
    
    def prever(self, dados):
        return np.array([self._travessia_arvore(amostra, self.raiz) for amostra in dados])
    
    def prever_proba(self, dados):
        """Para classifica√ß√£o: retorna probabilidades"""
        if self.tipo != 'classificacao':
            raise ValueError("prever_proba s√≥ dispon√≠vel para classifica√ß√£o")
        
        def _probabilidades(amostra, no):
            if no.valor is not None:
                # Retorna distribui√ß√£o de probabilidades
                return {no.valor: 1.0}
            
            if amostra[no.caracteristica] <= no.limite:
                return _probabilidades(amostra, no.esquerda)
            else:
                return _probabilidades(amostra, no.direita)
        
        return [_probabilidades(amostra, self.raiz) for amostra in dados]
    
    def _travessia_arvore(self, amostra, no):
        if no.valor is not None:
            return no.valor
        if amostra[no.caracteristica] <= no.limite:
            return self._travessia_arvore(amostra, no.esquerda)
        return self._travessia_arvore(amostra, no.direita)

# --- EXEMPLOS PR√ÅTICOS ---

def exemplo_classificacao():
    """Exemplo com dataset Iris"""
    from sklearn.datasets import load_iris
    from sklearn.model_selection import train_test_split
    from sklearn.metrics import accuracy_score, classification_report
    
    # Carregar dados
    iris = load_iris()
    X, y = iris.data, iris.target
    
    # Dividir treino/teste
    X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, test_size=0.2, random_state=42)
    
    # Criar e treinar √°rvore
    arvore = ArvoreDecisaoAprimorada(
        profundidade_maxima=5,
        min_amostras_divisao=3,
        min_ganho_informacao=0.01,
        tipo='classificacao'
    )
    
    arvore.ajustar(X_treino, y_treino)
    
    # Previs√µes
    predicoes = arvore.prever(X_teste)
    acuracia = accuracy_score(y_teste, predicoes)
    
    print(f"‚úÖ Acur√°cia: {acuracia:.3f}")
    print(f"üìä Profundidade real: {arvore.profundidade_arvore()}")
    print("üéØ Import√¢ncia das features:")
    print(arvore.obter_importancias(iris.feature_names))
    
    return arvore, acuracia

def exemplo_regressao():
    """Exemplo com dataset de pre√ßos de casas"""
    from sklearn.datasets import fetch_california_housing
    from sklearn.model_selection import train_test_split
    from sklearn.metrics import mean_squared_error, r2_score
    
    # Carregar dados
    housing = fetch_california_housing()
    X, y = housing.data, housing.target
    
    # Amostrar para melhor performance
    indices = np.random.choice(len(X), 1000, replace=False)
    X, y = X[indices], y[indices]
    
    X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, test_size=0.2, random_state=42)
    
    # √Årvore de regress√£o
    arvore = ArvoreDecisaoAprimorada(
        profundidade_maxima=8,
        min_amostras_divisao=5,
        tipo='regressao'
    )
    
    arvore.ajustar(X_treino, y_treino)
    predicoes = arvore.prever(X_teste)
    
    mse = mean_squared_error(y_teste, predicoes)
    r2 = r2_score(y_teste, predicoes)
    
    print(f"üìà MSE: {mse:.4f}")
    print(f"üìä R¬≤ Score: {r2:.4f}")
    print("üéØ Features mais importantes:")
    print(arvore.obter_importancias(housing.feature_names))
    
    return arvore, r2

if __name__ == "__main__":
    print("üå≥ √ÅRVORE DE DECIS√ÉO APRIMORADA")
    print("=" * 50)
    
    print("\n1. CLASSIFICA√á√ÉO (Dataset Iris):")
    arvore_class, acc = exemplo_classificacao()
    
    print("\n2. REGRESS√ÉO (Dataset California Housing):")
    arvore_reg, r2 = exemplo_regressao()