# Sistema de Detección de Fraude Crediticio Inmobiliario

## Objetivo del Proyecto
Detectar **solicitudes de crédito fraudulentas** mediante la identificación de patrones anómalos, inconsistencias y comportamientos sospechosos en solicitudes de préstamos inmobiliarios.

### Diferencia Clave
- **Impago (default)**: Cliente legítimo que no puede pagar
- **Fraude**: Solicitud con intención de engañar desde el inicio
- **Nuestro enfoque**: Detectar casos con alta probabilidad de ser fraudulentos para revisión humana

## 1. Configuración del Entorno

In [6]:
# Instalación automática de dependencias faltantes
import subprocess
import sys

def instalar_paquete(paquete):
    """Instalar paquete si no está disponible"""
    try:
        subprocess.check_call([sys.executable, "-m", "pip", "install", paquete])
        return True
    except:
        return False


In [7]:
# Instalación automática de dependencias faltantes
import subprocess
import sys

def instalar_paquete(paquete):
    """Instalar paquete si no está disponible"""
    try:
        subprocess.check_call([sys.executable, "-m", "pip", "install", paquete])
        return True
    except:
        return False

# Verificar e instalar dependencias críticas
dependencias_criticas = ['lightgbm', 'shap']
for dep in dependencias_criticas:
    try:
        __import__(dep)
    except ImportError:
        instalar_paquete(dep)

# Librerías principales
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# Machine Learning
from sklearn.model_selection import train_test_split, StratifiedKFold
from sklearn.preprocessing import StandardScaler, RobustScaler, LabelEncoder
from sklearn.impute import SimpleImputer
from sklearn.ensemble import RandomForestClassifier, IsolationForest, GradientBoostingClassifier
from sklearn.neighbors import LocalOutlierFactor
from sklearn.linear_model import LogisticRegression
from sklearn.manifold import TSNE
from sklearn.cluster import DBSCAN
from sklearn.metrics import (roc_auc_score, precision_recall_curve, average_precision_score,
                           precision_score, recall_score, f1_score, roc_curve, confusion_matrix,
                           silhouette_score)

# Gradient Boosting (con alternativa si falla)
try:
    import lightgbm as lgb
    LIGHTGBM_DISPONIBLE = True
    print("LightGBM disponible")
except ImportError:
    from sklearn.ensemble import GradientBoostingClassifier
    LIGHTGBM_DISPONIBLE = False
    print("LightGBM no disponible - usando GradientBoostingClassifier de sklearn")

# Deep Learning (opcional)
try:
    import tensorflow as tf
    from tensorflow.keras.models import Sequential
    from tensorflow.keras.layers import Dense
    tf.random.set_seed(42)
    TENSORFLOW_DISPONIBLE = True
except ImportError:
    from sklearn.neural_network import MLPRegressor
    TENSORFLOW_DISPONIBLE = False

# Interpretabilidad (opcional)
try:
    import shap
    SHAP_DISPONIBLE = True
except ImportError:
    SHAP_DISPONIBLE = False

# Configuración general
import os
import gc
from typing import Tuple, Dict, List

SEMILLA_ALEATORIA = 42
np.random.seed(SEMILLA_ALEATORIA)
plt.style.use('default')
plt.rcParams['figure.figsize'] = (12, 8)
sns.set_palette("husl")

  from .autonotebook import tqdm as notebook_tqdm


LightGBM disponible
