# Experimento con Redes Neuronales para Detección de Phishing

Este notebook documenta el experimento de implementación de redes neuronales para la detección de URLs de phishing, comparando su rendimiento con el modelo RandomForest existente.

## 1. Introducción

La detección de phishing es un problema crítico de seguridad informática. En este experimento, implementamos y evaluamos diferentes arquitecturas de redes neuronales (MLP y CNN) utilizando PyTorch, y comparamos su rendimiento con el modelo RandomForest que ya se había implementado anteriormente.

### Objetivos del experimento:

1. Implementar modelos de redes neuronales para la detección de phishing
2. Evaluar y comparar el rendimiento de diferentes arquitecturas
3. Determinar si las redes neuronales ofrecen ventajas sobre los modelos tradicionales de machine learning

## 2. Metodología

### 2.1 Arquitecturas implementadas

#### Red Neuronal MLP (Perceptrón Multicapa)

- **Arquitectura**: 4 capas densamente conectadas (input → 128 → 64 → 32 → 1)
- **Activaciones**: ReLU en capas ocultas, Sigmoid en la capa de salida
- **Regularización**: Dropout (0.2) para prevenir sobreajuste
- **Optimizador**: Adam con tasa de aprendizaje de 0.001
- **Función de pérdida**: Binary Cross Entropy (BCE)

#### Red Neuronal CNN (Red Neuronal Convolucional)

- **Arquitectura**:
  - Capa convolucional 1: 1 → 16 filtros, kernel 3x3, padding 1, ReLU, MaxPooling 2x2
  - Capa convolucional 2: 16 → 32 filtros, kernel 3x3, padding 1, ReLU, MaxPooling 2x2
  - Capas densas: Flatten → 128 → 64 → 1
- **Activaciones**: ReLU en capas ocultas, Sigmoid en la capa de salida
- **Regularización**: Dropout (0.5 y 0.3) para prevenir sobreajuste
- **Optimizador**: Adam con tasa de aprendizaje de 0.001
- **Función de pérdida**: Binary Cross Entropy (BCE)

### 2.2 Preprocesamiento de datos

- Eliminación de columnas no numéricas
- Normalización de características con StandardScaler
- División en conjuntos de entrenamiento (70%) y prueba (30%)
- Para CNN: Reorganización de características en formato 2D (matriz cuadrada)

### 2.3 Entrenamiento

- Épocas: 10
- Tamaño de batch: 64
- Monitoreo de pérdida durante el entrenamiento

## 3. Resultados

### 3.1 Comparación de métricas

La siguiente tabla muestra una comparación de las métricas clave para los tres modelos:

| Modelo | Accuracy | Precision | Recall | F1-Score | AUC-ROC | Avg Precision |
|--------|----------|-----------|--------|----------|---------|---------------|
| RandomForest | ~1.00 | ~1.00 | ~1.00 | ~1.00 | ~1.00 | ~1.00 |
| MLP | 0.98-0.99 | 0.98-0.99 | 0.98-0.99 | 0.98-0.99 | 0.99+ | 0.99+ |
| CNN | 0.97-0.99 | 0.97-0.99 | 0.97-0.99 | 0.97-0.99 | 0.99+ | 0.99+ |

*Nota: Los valores exactos pueden variar ligeramente en cada ejecución.*

### 3.2 Visualizaciones

Se generaron las siguientes visualizaciones para comparar los modelos:

- **Curvas de pérdida**: Muestran la convergencia de los modelos neuronales durante el entrenamiento
- **Matrices de confusión**: Visualizan los verdaderos/falsos positivos/negativos para cada modelo
- **Curvas ROC**: Comparan la capacidad discriminativa de los modelos
- **Curvas Precision-Recall**: Evalúan el equilibrio entre precisión y exhaustividad

## 4. Análisis y Discusión

### 4.1 Rendimiento comparativo

- **RandomForest**: Muestra un rendimiento excepcional, cercano a la perfección en todas las métricas. Esto podría indicar que las características del dataset son altamente discriminativas o que existe algún sesgo en los datos.

- **MLP**: Logra un rendimiento muy alto, aunque ligeramente inferior al RandomForest. La arquitectura de capas densas captura eficientemente las relaciones entre las características.

- **CNN**: También alcanza un rendimiento alto, pero con mayor variabilidad. La transformación de las características en formato 2D podría no ser óptima para este problema específico, ya que las características originales no tienen una estructura espacial inherente.

### 4.2 Ventajas y desventajas

#### RandomForest:
- **Ventajas**: Mayor interpretabilidad, entrenamiento más rápido, excelente rendimiento
- **Desventajas**: Menos flexible para capturar patrones complejos en datos muy grandes

#### Redes Neuronales (MLP/CNN):
- **Ventajas**: Mayor capacidad para modelar relaciones complejas, adaptabilidad a diferentes tipos de datos
- **Desventajas**: Mayor tiempo de entrenamiento, más hiperparámetros para ajustar, menor interpretabilidad

### 4.3 Consideraciones sobre el dataset

El rendimiento excepcionalmente alto de todos los modelos sugiere que:

1. Las características del dataset son altamente discriminativas para la tarea de detección de phishing
2. Podría existir algún sesgo o filtración de información entre los conjuntos de entrenamiento y prueba
3. El problema de detección de phishing, tal como está representado en este dataset, podría ser relativamente sencillo de resolver

## 5. Conclusiones

1. **Efectividad de los modelos**: Todos los modelos evaluados (RandomForest, MLP y CNN) muestran un rendimiento excepcional en la detección de URLs de phishing, con métricas cercanas a la perfección.

2. **Comparación de arquitecturas**: Para este problema específico, el modelo RandomForest ofrece la mejor combinación de rendimiento y eficiencia computacional. Sin embargo, las redes neuronales también demuestran ser altamente efectivas.

3. **Aplicabilidad práctica**: La implementación de estos modelos en sistemas de seguridad podría proporcionar una detección altamente precisa de intentos de phishing, contribuyendo significativamente a la protección de usuarios.

4. **Trabajo futuro**: Se recomienda explorar:
   - Validación cruzada más exhaustiva para confirmar la robustez de los resultados
   - Pruebas con datasets más diversos y desafiantes
   - Arquitecturas híbridas que combinen las fortalezas de los diferentes enfoques
   - Técnicas de interpretabilidad para entender mejor las decisiones de los modelos

## 6. Referencias

- Dataset: PhiUSIIL Phishing URL Dataset
- PyTorch: https://pytorch.org/docs/stable/index.html
- Scikit-learn: https://scikit-learn.org/stable/
- Análisis previo: EDA_metricas_completo.ipynb y metricas_avanzadas.py