In [None]:
!pip install requests pandas pymongo seaborn matplotlib

In [None]:
import requests
from pymongo import MongoClient
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

viajes = pd.read_csv('viajes.csv')
print(viajes)
plazas = pd.read_csv('plazas.csv')
print(plazas)
personas = pd.read_csv('personas.csv')
print(personas)
lista_espera = pd.read_csv('lista_espera.csv')
print(lista_espera)

In [None]:
# Combina los datos de personas y viajes usando la columna 'ID' como clave primaria
data = pd.merge(personas, viajes, how='left', left_on='ID', right_on='ID')

# Filtra las personas con y sin viaje asignado
con_viaje = data[data['Viaje_asignado'] == 'Si']
sin_viaje = data[data['Viaje_asignado'] == 'No']

# Gráfico de barras para comparar la renta media
plt.figure(figsize=(10, 6))
sns.set(style="whitegrid")
sns.barplot(x='Viaje_asignado', y='Renta', data=data, estimator=pd.Series.median, ci=None)

# Añade etiquetas y título
plt.title('Comparación de la Renta Media entre Personas con y sin Viaje Asignado')
plt.xlabel('Viaje Asignado')
plt.ylabel('Renta Media')

# Muestra el gráfico
plt.show()

In [None]:
# Combina los datos de personas y viajes usando la columna 'ID_persona' y 'ID_viaje'
data = pd.merge(personas, viajes, how='left', left_on='id_persona', right_on='id_viaje')

# Filtra las personas con y sin viaje asignado
con_viaje = data[data['viaje_asignado'] == 'Si']
sin_viaje = data[data['viaje_asignado'] == 'No']

# Gráfico de caja para comparar la distribución de edades
plt.figure(figsize=(12, 8))
sns.set(style="whitegrid")
sns.boxplot(x='viaje_asignado', y='Edad', data=data)

# Añade etiquetas y título
plt.title('Comparación de Edades entre Personas con y sin Viaje Asignado')
plt.xlabel('Viaje Asignado')
plt.ylabel('Edad')

# Muestra el gráfico
plt.show()

In [None]:
# Listas de provincias según las preferencias
viaje_montaña_provincias = ["Asturias", "Cantabria", "Huesca", "Lérida", "Navarra", "Granada", "Lugo"]
viaje_cultural_provincias = ["Burgos", "Cuenca", "Segovia", "Zaragoza", "Cáceres", "León", "Sevilla", "Toledo", "Ávila", "Córdoba", "Salamanca", "Valladolid"]
viaje_rural_provincias = ["Pontevedra", "Zamora", "Albacete", "Badajoz", "Ciudad Real", "Guadalajara", "Jaén", "Orense", "Palencia", "Soria", "Teruel"]
viaje_islas_provincias = ["Santa Cruz de Tenerife", "Las Palmas", "Islas Baleares"]
viaje_playa_provincias = ["Alicante", "Almeria", "Cadiz", "Castellón", "Girona", "Huelva", "Málaga", "Murcia", "Tarragona"]
viaje_gastronómico_provincias = ["Barcelona", "Guipúzcoa", "Madrid", "Valencia", "Álava", "La Rioja", "Vizcaya", "A Coruña"]

# Combinar los datos de personas y viajes
data = pd.merge(personas, viajes, how='left', left_on='id_persona', right_on='id_viaje')

# Filtrar las personas con viaje asignado
con_viaje = data[data['viaje_asignado'] == 'Si']

# Función para clasificar la preferencia de una persona
def clasificar_preferencias(row):
    if row['Ciudad'] in viaje_montaña_provincias and row['Preferencia_1'] == 'Montaña':
        return 'Preferencia_1'
    elif row['Ciudad'] in viaje_cultural_provincias and row['Preferencia_1'] == 'Cultural':
        return 'Preferencia_1'
    elif row['Ciudad'] in viaje_rural_provincias and row['Preferencia_1'] == 'Rural':
        return 'Preferencia_1'
    elif row['Ciudad'] in viaje_islas_provincias and row['Preferencia_1'] == 'Islas':
        return 'Preferencia_1'
    elif row['Ciudad'] in viaje_playa_provincias and row['Preferencia_1'] == 'Playa':
        return 'Preferencia_1'
    elif row['Ciudad'] in viaje_gastronómico_provincias and row['Preferencia_1'] == 'Gastronómico':
        return 'Preferencia_1'
    elif row['Ciudad'] in viaje_montaña_provincias and row['Preferencia_2'] == 'Montaña':
        return 'Preferencia_2'
    elif row['Ciudad'] in viaje_cultural_provincias and row['Preferencia_2'] == 'Cultural':
        return 'Preferencia_2'
    elif row['Ciudad'] in viaje_rural_provincias and row['Preferencia_2'] == 'Rural':
        return 'Preferencia_2'
    elif row['Ciudad'] in viaje_islas_provincias and row['Preferencia_2'] == 'Islas':
        return 'Preferencia_2'
    elif row['Ciudad'] in viaje_playa_provincias and row['Preferencia_2'] == 'Playa':
        return 'Preferencia_2'
    elif row['Ciudad'] in viaje_gastronómico_provincias and row['Preferencia_2'] == 'Gastronómico':
        return 'Preferencia_2'
    else:
        return 'Otro'

# Aplicar la función para clasificar las preferencias
con_viaje['Clasificacion'] = con_viaje.apply(clasificar_preferencias, axis=1)

# Contar el número de personas en cada categoría
conteo_preferencia_1 = con_viaje['Clasificacion'].eq('Preferencia_1').sum()
conteo_preferencia_2 = con_viaje['Clasificacion'].eq('Preferencia_2').sum()
conteo_otro = con_viaje['Clasificacion'].eq('Otro').sum()

# Calcular el porcentaje de personas cuya ciudad asignada pertenece a su Preferencia_1
porcentaje_pref_1 = (conteo_preferencia_1 / len(con_viaje)) * 100

# Calcular el porcentaje de personas cuya ciudad asignada pertenece a su Preferencia_2
porcentaje_pref_2 = (conteo_preferencia_2 / len(con_viaje)) * 100

# Calcular el porcentaje de personas cuya ciudad asignada no pertenece ni a Preferencia_1 ni a Preferencia_2
porcentaje_otro = (conteo_otro / len(con_viaje)) * 100

# Imprimir estadísticas
print(f"Porcentaje de personas con Preferencia_1: {porcentaje_pref_1:.2f}%")
print(f"Porcentaje de personas con Preferencia_2: {porcentaje_pref_2:.2f}%")
print(f"Porcentaje de personas clasificadas como 'Otro': {porcentaje_otro:.2f}%")

# Crear un gráfico de barras
plt.figure(figsize=(10, 6))
sns.barplot(x=['Preferencia_1', 'Preferencia_2', 'Otro'],
            y=[porcentaje_pref_1, porcentaje_pref_2, porcentaje_otro])

# Añadir etiquetas y título
plt.title('Porcentaje de Personas con Viaje Asignado según Preferencias')
plt.xlabel('Categoría')
plt.ylabel('Porcentaje')

# Mostrar el gráfico
plt.show()