In [None]:
!pip install pymongo seaborn matplotlib requests pandas

In [None]:
import requests
from pymongo import MongoClient
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

viajes = pd.read_csv('viajes.csv')
print(viajes)
plazas = pd.read_csv('plazas.csv')
print(plazas)
personas = pd.read_csv('personas.csv')
print(personas)
lista_espera = pd.read_csv('lista_espera.csv')
print(lista_espera)

In [None]:
# Combina los datos de personas y viajes usando las columnas 'id_persona' y 'id_viaje'
data = pd.merge(personas, viajes, how='left', left_on='id_persona', right_on='id_viaje')

# Filtra las personas con y sin viaje asignado
con_viaje = data[data['viaje_asignado'] == 'Si']
sin_viaje = data[data['viaje_asignado'] == 'No']

# Gráfico de barras para comparar la renta media
plt.figure(figsize=(10, 6))
sns.set(style="whitegrid")
sns.barplot(x='viaje_asignado', y='Renta', data=data, estimator=pd.Series.median, errorbar=None)

# Añade etiquetas y título
plt.title('Comparación de la Renta Media entre Personas con y sin Viaje Asignado')
plt.xlabel('Viaje Asignado')
plt.ylabel('Renta Media')

# Muestra el gráfico
plt.show()

In [None]:
# Combina los datos de personas y viajes usando la columna 'ID_persona' y 'ID_viaje'
data = pd.merge(personas, viajes, how='left', left_on='id_persona', right_on='id_viaje')

# Filtra las personas con y sin viaje asignado
con_viaje = data[data['viaje_asignado'] == 'Si']
sin_viaje = data[data['viaje_asignado'] == 'No']

# Gráfico de caja para comparar la distribución de edades
plt.figure(figsize=(12, 8))
sns.set(style="whitegrid")
sns.boxplot(x='viaje_asignado', y='Edad', data=data)

# Añade etiquetas y título
plt.title('Comparación de Edades entre Personas con y sin Viaje Asignado')
plt.xlabel('Viaje Asignado')
plt.ylabel('Edad')

# Muestra el gráfico
plt.show()

In [None]:
data = pd.merge(personas, viajes, how='left', left_on='id_persona', right_on='id_persona')

# Filtrar las personas con viaje asignado
con_viaje = data[data['viaje_asignado'] == 'Si']

# Contar el número de personas en cada categoría
conteo_preferencia_1 = con_viaje['tipo_exp'].eq(con_viaje['Preferencia_1']).sum()
conteo_preferencia_2 = con_viaje['tipo_exp'].eq(con_viaje['Preferencia_2']).sum()
conteo_otro = len(con_viaje) - conteo_preferencia_1 - conteo_preferencia_2

# Calcular el porcentaje de personas cuya ciudad asignada pertenece a su Preferencia_1
porcentaje_pref_1 = (conteo_preferencia_1 / len(con_viaje)) * 100

# Calcular el porcentaje de personas cuya ciudad asignada pertenece a su Preferencia_2
porcentaje_pref_2 = (conteo_preferencia_2 / len(con_viaje)) * 100

# Calcular el porcentaje de personas cuya ciudad asignada no pertenece ni a Preferencia_1 ni a Preferencia_2
porcentaje_otro = (conteo_otro / len(con_viaje)) * 100

# Imprimir estadísticas
print(f"Porcentaje de personas que han podido ir a su primera preferencia: {porcentaje_pref_1:.2f}%")
print(f"Porcentaje de personas que han podido ir a su segunda preferencia: {porcentaje_pref_2:.2f}%")
print(f"Porcentaje de personas que se les ha asignado otro destino: {porcentaje_otro:.2f}%")

# Crear un gráfico de barras
plt.figure(figsize=(10, 6))
sns.barplot(x=['Preferencia_1', 'Preferencia_2', 'Otro'],
            y=[porcentaje_pref_1, porcentaje_pref_2, porcentaje_otro])

# Añadir etiquetas y título
plt.title('Porcentaje de Personas con Viaje Asignado según Preferencias')
plt.xlabel('Categoría')
plt.ylabel('Porcentaje')

# Mostrar el gráfico
plt.show()

In [None]:
data = pd.merge(personas, viajes, how='left', left_on='id_persona', right_on='id_persona')

# Crear una nueva columna para identificar si la persona tiene discapacidad o no
data['Tiene_Discapacidad'] = data['Discapacidad'] > 0

# Filtrar personas con discapacidad
con_discapacidad = data[data['Tiene_Discapacidad']]

# Filtrar personas sin discapacidad
sin_discapacidad = data[~data['Tiene_Discapacidad']]

# Filtrar personas con viaje asignado
con_viaje = data[data['viaje_asignado'] == 'Si']

# Calcular porcentajes
porcentaje_discapacidad_con_viaje = (len(con_discapacidad[con_discapacidad['viaje_asignado'] == 'Si']) / len(con_discapacidad)) * 100
porcentaje_discapacidad_sin_viaje = (len(con_discapacidad[con_discapacidad['viaje_asignado'] == 'No']) / len(con_discapacidad)) * 100
porcentaje_sin_discapacidad_con_viaje = (len(sin_discapacidad[sin_discapacidad['viaje_asignado'] == 'Si']) / len(sin_discapacidad)) * 100

# Gráfico de barras para ilustrar el porcentaje de personas con discapacidad que viajan y que no viajan
plt.figure(figsize=(14, 8))

plt.subplot(1, 3, 1)
sns.barplot(x=['Viajan', 'No Viajan'],
            y=[porcentaje_discapacidad_con_viaje, porcentaje_discapacidad_sin_viaje])
plt.title('Porcentaje de Personas con Discapacidad que Viajan y No Viajan')
plt.ylabel('Porcentaje')

# Gráfico de tarta para ilustrar la proporción de personas con y sin discapacidad que viajan y no viajan
plt.subplot(1, 3, 3)
plt.pie([len(con_discapacidad), len(sin_discapacidad)], labels=['Con Discapacidad', 'Sin Discapacidad'], autopct='%1.1f%%', colors=['lightblue', 'lightgreen'])
plt.title('Proporción de Personas con y sin Discapacidad que Viajan')

# Mostrar los gráficos
plt.show()
