Este proyecto implementa una Red Neuronal Artificial (ANN) utilizando el lenguaje R para analizar datos demográficos históricos y predecir la afiliación de docentes al partido Nazi en la Alemania de los años 30.
El objetivo principal es determinar si un profesor era miembro del partido basándose en cuatro variables categóricas: Religión, Cohorte (generación), Residencia y Género.
El desafío técnico principal del dataset fue el manejo de datos agrupados (frecuencias), lo que requirió técnicas de preprocesamiento para expandir los registros individuales antes del entrenamiento del modelo.
- Lenguaje: R (v4.x)
- Librerías:
neuralnet - Técnicas: Normalización Min-Max, Expansión de datos ponderados, Perceptrón Multicapa.
- Limpieza de Datos: Corrección de la lectura del archivo
nazi.txteliminando separadores incorrectos. - Ingeniería de Características: * Expansión del dataset de 17 filas resumen a 13,566 registros individuales utilizando la columna de recuento (
Co).- Normalización de variables de entrada al rango [0, 1].
- Entrenamiento: * División del dataset: 70% Entrenamiento / 30% Prueba.
- Configuración de la Red: 4 Entradas -> 3 Neuronas Ocultas -> 1 Salida.
- Evaluación: Matriz de Confusión y cálculo de precisión (Accuracy).
El modelo final logró converger exitosamente con los siguientes métricas:
- Pasos de entrenamiento: ~5,300
- Error: ~717.96
- Precisión (Accuracy) en Test: 77.71%
analisis.R: Script principal con todo el flujo de trabajo.nazi.txt: Dataset original (Fuente: Jarausch, K. H., & Arminger, G. (1989)).
Axel Tapia