Realizare un ejercicio típico de regresión lineal múltiple utilizando datos de la NASA, los cuales buscaban determinar perfiles aerodinámicos ideales ante diferentes condiciones, dichas condiciones serán las variables x o independientes de nuestro sistema.
Se dividen los datos en datos de entrenamiento y de prueba, se encuentran las betas y se encuentran correlaciones y se jerarquizan, además la información se presenta de manera conveniente para entender los resultados del ejercicio.
Los datos fueron originalmente publicados por la NASA:
https://ntrs.nasa.gov/api/citations/19890016302/downloads/19890016302.pdf
Y fueron obtenidos de UCI MACHINE LEARNING REPOSITORY:
https://archive.ics.uci.edu/dataset/291/airfoil+self+noise
La base de datos cuenta con la siguiente información:
- “frecuencia”. Frecuencia, en Hz.
- “longitud”. Longitud de cuerda geométrica, en metros.
- “velocidad”. Velocidad de flujo libre, en metros por segundo.
- “espesor”. Espesor del desplazamiento en el lado de succión, en metros.
- “presión”. Nivel escalado de presión sonora, en dB
Dichos datos fueron modificados para ser más fáciles de trabajar, si quieres replicar el código o verificar su funcionamiento puedes encontrar el archivo en este repositorio.