# Preprocesamiento 

Este DataFrame encontramos un conjunto de datos de retroalimentación o encuestas relacionadas con la experiencia de los pasajeros en vuelos, nuestro objetivo predecir o analizar la satisfacción del cliente. Las columnas son:
1. **satisfaction:** Indica la satisfacción del cliente, probablemente como una etiqueta de clase (por ejemplo, "satisfied" o "unsatisfied").
2. **Gender:** El género del pasajero (por ejemplo, "Female" o "Male").
3. **Customer Type:** El tipo de cliente, posiblemente indicando si el cliente es un "Loyal Customer" (cliente leal) u otro tipo.
4. **Age:** La edad del pasajero.
5. **Type of Travel:** El propósito del viaje, como "Personal Travel" (viaje personal).
6. **Class:** La clase del vuelo, como "Eco" (económica) o "Business" (negocios).
7. **Flight Distance:** La distancia del vuelo en kilómetros.
8. **Seat comfort:** Evaluación de la comodidad del asiento (posiblemente en una escala).
9. **Departure/Arrival time convenient:** Evaluación de la conveniencia de los horarios de salida/llegada.
10. **Food and drink:** Evaluación de la comida y bebida a bordo.
11. **Gate location:** Evaluación de la ubicación de la puerta de embarque.
12. **Inflight wifi service:** Evaluación del servicio de wifi a bordo.
13. **Inflight entertainment:** Evaluación del entretenimiento a bordo.
14. **Online support:** Evaluación del soporte en línea.
15. **Ease of Online booking:** Evaluación de la facilidad de reserva en línea.
16. **On-board service:** Evaluación del servicio a bordo.
17. **Leg room service:** Evaluación del espacio para las piernas.
18. **Baggage handling:** Evaluación del manejo del equipaje.
19. **Checkin service:** Evaluación del servicio de check-in.
20. **Cleanliness:** Evaluación de la limpieza en el avión.
21. **Online boarding:** Evaluación del proceso de embarque en línea.
22. **Departure Delay in Minutes:** La demora en minutos en la salida del vuelo.
23. **Arrival Delay in Minutes:** La demora en minutos en la llegada del vuelo.









In [1]:

# Tratamiento de datos
# ==============================================================================
import numpy as np
import pandas as pd


# Gráficos
# ==============================================================================
import matplotlib.pyplot as plt
from matplotlib import style
import matplotlib.ticker as ticker
import seaborn as sns



# Preprocesamiento
# ==============================================================================
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import RobustScaler
from sklearn.preprocessing import OneHotEncoder  
from sklearn.preprocessing import OrdinalEncoder
import math
from sklearn.preprocessing import MinMaxScaler
from scipy import stats


# Imputación de nulos usando métodos avanzados estadísticos
# -----------------------------------------------------------------------
from sklearn.impute import SimpleImputer
from sklearn.experimental import enable_iterative_imputer
from sklearn.impute import IterativeImputer
from sklearn.impute import KNNImputer


#Linear Regresion con Sklearn
# ==============================================================================
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn import metrics




# Configuración warnings
# ==============================================================================
import warnings
warnings.filterwarnings('ignore')


# Tamaño gráficas
# ==============================================================================
plt.rcParams["figure.figsize"] = (10,8)

In [2]:
df = pd.read_csv('satisfaccion_aerolineas.csv', index_col=0)
df.head()

Unnamed: 0,satisfaction,Gender,Customer Type,Age,Type of Travel,Class,Flight Distance,Seat comfort,Departure/Arrival time convenient,Food and drink,...,Online support,Ease of Online booking,On-board service,Leg room service,Baggage handling,Checkin service,Cleanliness,Online boarding,Departure Delay in Minutes,Arrival Delay in Minutes
0,satisfied,Female,Loyal Customer,,Personal Travel,Eco,,0,0.0,0.0,...,2,,3.0,0.0,3.0,5.0,3.0,2.0,0.0,0.0
1,satisfied,Male,Loyal Customer,47.0,Personal Travel,,2464.0,0,0.0,0.0,...,2,3.0,4.0,4.0,4.0,2.0,3.0,2.0,310.0,305.0
2,satisfied,Female,Loyal Customer,,Personal Travel,Eco,,0,0.0,0.0,...,2,2.0,,3.0,4.0,4.0,4.0,2.0,0.0,0.0
3,satisfied,Female,Loyal Customer,,Personal Travel,Eco,623.0,0,0.0,0.0,...,3,1.0,1.0,,,,1.0,3.0,0.0,0.0
4,satisfied,Female,Loyal Customer,,Personal Travel,,354.0,0,0.0,0.0,...,4,2.0,2.0,0.0,2.0,4.0,,5.0,0.0,0.0
