# Proyecto de Aprendizaje Automático
## Perceptrón Multicapa
Este proyecto es una introducción a las redes neuronales artificiales: con la implementación de perceptrones multicapa.  
Se utilizan los datos del Wisconsin Breast Cancer Dataset (WBCD).

## Estructura de ficheros

```bash
/perceptron
│
├── data/                              # Carpeta para datos crudos y preprocesados
│   ├── raw/                           # Datos originales
│   │   └── data.csv                   # Archivo de datos principal
│   └── processed/                     # Datos preprocesados y normalizados
│       ├─── log_normalized.csv        # Dataset normalizado con Log Transform
│       ├─── minmax_normalized.csv     # Dataset normalizado con Min-Max Scaling
│       ├─── robust_normalized.csv     # Dataset normalizado con Rotust Scaling
│       └─── zscore_normalized.csv     # Dataset normalizado con Z-score Normalization
├── notebooks/                         # Archivos Jupyter Notebook
│   ├── 0 main.ipynb                   # Orquestador principal
│   ├── 1 data_analysis.ipynb          # Análisis de datos
│   ├── 2 normalization.ipynb          # Normalización de datos
│   ├── 3 data_visualization.ipynb     # Visualización de datos
│   ├── data_preprocessing.ipynb       # Preprocesamiento
│   ├── model_training.ipynb           # Entrenamiento del modelo
│   ├── prediction.ipynb               # Predicción y evaluación
│   └── documentation.ipynb            # Documentación de funciones
├── output/                            # Resultados del proyecto
│   ├── figures/                       # Imágenes y gráficos
│   │   ├──── boxplot_features.png     # Gráfico de caja (boxplots)
│   │   ├──── correlation_heatmap.png  # Gráfico Heatmap: mapa de calor para correlaciones
│   │   ├──── feature_importance.png   # Gráfico de Barras de Importancia de Característic
│   │   ├──── pairplot_features.png    # Gráfico de Pares para las características más relevantes
│   │   ├──── pca_visualization.png    # Gráfico para ver la separación de clases
│   │   ├──── radar_plot.png           # Gráfico de radar
│   │   ├──── violin_plot_log.png      # Gráfico de violín con normalización log
│   │   ├──── violin_plot_minmax.png   # Gráfico de violín con normalización min-max
│   │   ├──── violin_plot_robust.png   # Gráfico de violín con normalización robusta
│   │   └──── violin_plot_zscore.png   # Gráfico de violín con normalización z-score
│   ├── models/                        # Resultados del modelo
│   └── features.json                  # JSON con las distribuciones de probabilidad
├── utils/                             # Funciones reutilizables
│   ├── config.py                      # Hiperparámetros y configuraciones
│   ├── neural_network_functions.py    # Funciones para el modelo
│   ├── statistical_functions.py       # Funciones estadísticas
│   ├── preprocessing_functions.py     # Funciones de preprocesamiento
│   └── evaluation_functions.py        # Funciones de evaluación
├── requirements.txt                   # Librerías usadas con Pip
└── README.md                          # Instalación e Introducción al proyecto
```

## Estructura de los Notebooks

0. main.ipynb
    - Punto de entrada del proyecto y
    - el "orquestador" del proyecto
    - Definimos los hiperparámetros y configuraciones
    - Llamamos a funciones
      
2. **Análisis de datos**: 
   - [1 data_analysis.ipynb](1_data_analysis.ipynb)
   - Primer paso para entender los datos
   - Análisis estadístico inicial
   - Identificación de características

4. data_visualization.ipynb
   - Visualización de distribuciones
   - Gráficos exploratorios
   - Comprensión visual de los datos

5. data_preprocessing.ipynb
   - Limpieza de datos
   - Normalización
       - Parámetro: diferentes métodos de normalización 
   - Separación de datos en entrenamiento y validación
       - Parámetro: el porcentaje de división train/val
   - Preparación para modelado

6. model_training.ipynb
   - Construcción del modelo
   - Función flexible para construir el modelo que acepte parámetros como:
        - Parámetro: número de capas
        - Parámetro: neuronas por capa
        - Parámetro: funciones de activación
        - Parámetro: diferentes inicializadores de pesos
        - Parámetro: tasa de aprendizaje
        - Parámetro: algoritmo de optimización
        - Parámetro: number of Epochs
   - Entrenamiento de la red neuronal

7. prediction.ipynb
   - Evaluación final
   - Predicciones
   - Métricas de rendimiento
   - Funciones para visualizar y comparar resultados de diferentes configuraciones


* Archivo JSON con las diferentes configuraciones

## Estructura del proyecto

### data/
- data.csv


### notebooks/
0. main.ipynb
1. data_preprocessing.ipynb
2. graphical_analysis.ipynb
3. neural_network_functions.ipynb
4. forward_backward_propagation.ipynb
5. training_loop.ipynb

### src/
- ft_functions.py

### output/
- 

## Contenido de los Notebooks

https://medium.com/@tutorialcreation81/exploratory-data-analysis-of-breast-cancer-dataset-8c4cd7712f6f

https://medium.com/analytics-vidhya/explainable-ai-the-next-level-c6b4dadc240

https://www.kaggle.com/code/hanzlanawaz/99-breast-cancer-prediction-using-xgboost


'radius_mean', 'texture_mean', 'perimeter_mean',
       'area_mean', 'smoothness_mean', 'compactness_mean', 'concavity_mean',
       'concave points_mean', 'symmetry_mean', 'fractal_dimension_mean',
       'radius_se', 'texture_se', 'perimeter_se', 'area_se', 'smoothness_se',
       'compactness_se', 'concavity_se', 'concave points_se', 'symmetry_se',
       'fractal_dimension_se', 'radius_worst', 'texture_worst',
       'perimeter_worst', 'area_worst', 'smoothness_worst',
       'compactness_worst', 'concavity_worst', 'concave points_worst',
       'symmetry_worst', 'fractal_dimension_worst'