# **Índice de habitabilidad basado en las métricas obtenidas y clasificar las ciudades en categorías**

In [None]:
import pandas as pd  # Importar la librería pandas para manejar datos en formato de tablas (dataframes)

# Agregar una nueva columna al DataFrame para calcular el índice de habitabilidad
def calcular_indice_habitabilidad(df):
    # Normalizar las métricas para que todas tengan valores comparables

    # Calcular un índice para la calidad del aire basado en el AQI (Air Quality Index). Invertimos el AQI para que valores más bajos (mejor calidad) tengan un puntaje más alto.
    df['indice_calidad_aire'] = 100 - df['aqi_us']  # Invertir AQI, valores más bajos son mejores

    # Calcular el índice de temperatura: Si está en el rango de 15-30°C, se considera ideal, de lo contrario se asigna un valor de 50.
    df['indice_temperatura'] = df['temperatura_c_x'].apply(lambda x: 100 if 15 <= x <= 30 else 50)

    # Calcular el índice de humedad: Si está en el rango de 30%-60%, se considera ideal, de lo contrario se asigna un valor de 50.
    df['indice_humedad'] = df['humedad_x'].apply(lambda x: 100 if 30 <= x <= 60 else 50)

    # Calcular el índice de viento: Si la velocidad del viento es mayor o igual a 2 m/s, se considera ideal, de lo contrario se asigna un valor de 50.
    df['indice_viento'] = df['velocidad_viento_m/s'].apply(lambda x: 100 if x >= 2 else 50)

    # Promediar los índices para obtener un índice general de habitabilidad
    # El índice de habitabilidad es el promedio de los índices de calidad del aire, temperatura, humedad y viento.
    df['indice_habitabilidad'] = (
        df['indice_calidad_aire'] +  # Índice de calidad del aire
        df['indice_temperatura'] +  # Índice de temperatura
        df['indice_humedad'] +      # Índice de humedad
        df['indice_viento']         # Índice de viento
    ) / 4  # Promedio de los 4 índices

    # Clasificar según umbrales
    # Función que clasifica la habitabilidad en categorías de "Alta Habitabilidad", "Moderada Habitabilidad" y "Baja Habitabilidad"
    def clasificar_habitabilidad(indice):
        if indice >= 75:  # Si el índice es mayor o igual a 75, la ciudad tiene alta habitabilidad
            return "Alta Habitabilidad"
        elif indice >= 50:  # Si el índice es mayor o igual a 50, pero menor a 75, la ciudad tiene moderada habitabilidad
            return "Moderada Habitabilidad"
        else:  # Si el índice es menor a 50, la ciudad tiene baja habitabilidad
            return "Baja Habitabilidad"

    # Aplicamos la función de clasificación a la columna 'indice_habitabilidad' para crear una nueva columna 'categoria_habitabilidad'
    df['categoria_habitabilidad'] = df['indice_habitabilidad'].apply(clasificar_habitabilidad)

    return df  # Devolvemos el DataFrame con las nuevas columnas y categorías

# Aplicar la función al DataFrame de comparación
comparacion = calcular_indice_habitabilidad(comparacion)  # Calculamos el índice de habitabilidad para cada ciudad

# Mostrar los resultados con las columnas relevantes
print("\nClasificación de habitabilidad de las ciudades:")
# Mostramos la ciudad, el índice de habitabilidad y la categoría de habitabilidad
print(comparacion[['ciudad', 'indice_habitabilidad', 'categoria_habitabilidad']])

# Identificar la ciudad con el índice de habitabilidad más alto (la mejor ciudad)
ciudad_ideal = comparacion.loc[comparacion['indice_habitabilidad'].idxmax()]  # Encontramos la ciudad con el índice máximo
print("\nLa ciudad con mayor habitabilidad es:")  # Mostramos el resultado
print(f"Ciudad: {ciudad_ideal['ciudad']}")
print(f"Índice de Habitabilidad: {ciudad_ideal['indice_habitabilidad']:.2f}")  # Mostramos el índice con dos decimales
print(f"Categoría: {ciudad_ideal['categoria_habitabilidad']}")  # Mostramos la categoría de la ciudad ideal