In [23]:
import pandas as pd
import numpy as np
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.graph_objects as go
import nbformat
import os
import dotenv #Uso de tokens
dotenv.load_dotenv()
import sys
sys.path.append("../")
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)

In [24]:
calendario_vuelos_londres = pd.read_csv("../datos/calendario_londres.csv", index_col= 0)
calendario_vuelos_munich = pd.read_csv("../datos/calendario_munich.csv", index_col = 0)

In [25]:
calendario_vuelos_londres.drop(columns="Fecha Captura", inplace= True)
calendario_vuelos_munich.drop(columns="Fecha Captura", inplace= True)

In [26]:
fig1 = px.scatter(calendario_vuelos_londres,
                x="Fecha",
                y="Precio", 
                title="Precios promedio por trayecto de los vuelos entre MAD y LGW entre Noviembre 2024 y Noviembre 2025",
                labels={"Fecha": "Fecha", "Precio": "Precio"})
                  
fig1.show()

In [27]:
fig2 = px.scatter(calendario_vuelos_munich,
                  x="Fecha", y="Precio", 
                  title="Precios promedio por trayecto de los vuelos entre MAD y MUC entre Noviembre 2024 y Noviembre 2025",
                  labels={"Fecha": "Fecha", "Precio": "Precio"})
fig2.show()

In [28]:
vuelos_londres = pd.read_csv("../datos/vuelos_londres.csv", index_col = 0)
vuelos_munich = pd.read_csv("../datos/vuelos_munich.csv", index_col = 0)

In [29]:
vuelos_londres.sample(2)

Unnamed: 0,Fecha Salida,Hora Salida,Fecha Llegada,Hora Llegada,Origen,Destino,Duración,Escalas,Aerolínea,Precio,Fecha Captura
15,2024-11-18,09:20:00,2024-11-18,19:30:00,London Gatwick,Madrid,550,1,Vueling Airlines,575.73,2024-10-19
10,2024-11-15,12:50:00,2024-11-15,20:20:00,Madrid,London Gatwick,510,1,Ryanair,371.52,2024-10-19


In [30]:
precio_avg_aerol_londres = round(vuelos_londres.groupby("Aerolínea")[["Precio"]].mean().reset_index().sort_values(by = "Precio", ascending=False),2)
precio_avg_aerol_londres

Unnamed: 0,Aerolínea,Precio
0,Iberia Express,482.04
3,Wizz Air Malta,444.43
2,Vueling Airlines,442.55
4,easyJet,414.87
1,Ryanair,368.71


In [31]:
precio_avg_aerol_munich = round(vuelos_munich.groupby("Aerolínea")[["Precio"]].mean().reset_index().sort_values(by = "Precio", ascending=False),2)
precio_avg_aerol_munich

Unnamed: 0,Aerolínea,Precio
1,Iberia,470.04
0,Air Europa,429.44


In [32]:
avg_vuelo_londres = precio_avg_aerol_londres["Precio"].mean()
avg_vuelo_munich = precio_avg_aerol_munich["Precio"].mean()

In [33]:
fig3 = px.bar(precio_avg_aerol_londres,
                    x="Aerolínea",
                    y="Precio",
                    title="Precio medio para 2 pax por aerolínea y por viaje ida y vuelta de MAD a LHR del 15 al 18 de nov. 2024",
                    text_auto=True)

fig3.update_layout(barmode='stack', xaxis={'categoryorder':'total descending'})

fig3.show()

In [34]:
fig4 = px.bar(precio_avg_aerol_munich,
                    x="Aerolínea",
                    y="Precio",
                    title="Precio medio para 2 pax por aerolínea y por viaje ida y vuelta de MAD a LHR del 15 al 18 de nov. 2024",
                    text_auto=True)

fig4.update_layout(barmode='stack', xaxis={'categoryorder':'total descending'})

fig4.show()

In [35]:
hoteles_londres = pd.read_csv("../datos/hoteles_londres.csv", index_col = 0)
hoteles_munich = pd.read_csv("../datos/hoteles_munich.csv", index_col = 0)

In [36]:
hoteles_londres.sample(2)

Unnamed: 0,Nombre,Entrada,Salida,Puntuación,Precio,Latitud,Longitud,Fecha Captura
11,Hyde Park Superior Apartments,2024-11-15,2024-11-18,7.2,435.43,51.511876,-0.186049,2024-10-19
8,The Corner London City,2024-11-15,2024-11-18,8.1,407.1,51.516089,-0.067742,2024-10-19


In [37]:
round(hoteles_londres[["Precio", "Puntuación"]].describe(),2)

Unnamed: 0,Precio,Puntuación
count,20.0,20.0
mean,482.74,7.86
std,56.22,0.6
min,405.04,7.0
25%,435.3,7.2
50%,482.56,8.05
75%,521.26,8.22
max,572.92,8.9


In [38]:
round(hoteles_munich[["Precio", "Puntuación"]].describe(),2)

Unnamed: 0,Precio,Puntuación
count,20.0,20.0
mean,425.54,8.11
std,21.63,0.54
min,402.0,6.7
25%,414.25,7.8
50%,419.0,8.1
75%,430.54,8.52
max,496.0,8.9


In [39]:
avg_hotel_londres = round(hoteles_londres["Precio"].mean(),2)
avg_hotel_munich = round(hoteles_munich["Precio"].mean(),2)
avg_rank_hotel_londres = round(hoteles_londres["Puntuación"].mean(),2)
avg_rank_hotel_munich = round(hoteles_munich["Puntuación"].mean(),2)

In [40]:
dicc_londres_hot = {"Ciudad":"Londres",
                "Precio Hotel":avg_hotel_londres,
                "Puntuación":avg_rank_hotel_londres}

dicc_munich_hot = {"Ciudad":"Munich",
                "Precio Hotel":avg_hotel_munich,
                "Puntuación":avg_rank_hotel_munich}


comparativa_hot_ciudades = [dicc_londres_hot,dicc_munich_hot]
df_hot_ciudades = pd.DataFrame(comparativa_hot_ciudades)
df_hot_ciudades

Unnamed: 0,Ciudad,Precio Hotel,Puntuación
0,Londres,482.74,7.86
1,Munich,425.54,8.11


In [41]:
fig5 = px.bar(df_hot_ciudades, x='Ciudad', y=['Puntuación','Precio Hotel'],
             hover_data=['Precio Hotel'],
             text_auto=True,
             labels={"value":"Puntuación media"},
             title = "Puntuación media de hoteles en Londres y Munich en un rango de 300 a 500EUR para 2 noches",
             height=400)
fig5.show()

In [42]:
mapbox_token = os.getenv("token_mapbox")

In [43]:
import plotly.express as px
px.set_mapbox_access_token(mapbox_token)

fig6 = px.scatter_mapbox(hoteles_londres, 
                         lat="Latitud", 
                         lon="Longitud",
                         hover_data={"Nombre","Precio","Puntuación"},
                         title="Hoteles por ubicación en Londres",
                         color_continuous_scale=px.colors.cyclical.IceFire,
                         size_max=15,
                         zoom=11,
                         height=500)
fig6.show()

In [44]:
fig7 = px.scatter_mapbox(hoteles_munich, 
                         lat="Latitud", 
                         lon="Longitud",
                         hover_data={"Nombre","Precio","Puntuación"},
                         title="Hoteles por ubicación en Munich",
                         color_continuous_scale=px.colors.cyclical.IceFire,
                         size_max=10,
                         zoom=12,
                         height=500)
fig7.show()

In [45]:
actividades_londres = pd.read_csv("../datos/actividades_londres.csv", index_col = 0)
actividades_munich = pd.read_csv("../datos/actividades_munich.csv", index_col = 0)

In [46]:
actividades_munich.sample(2)

Unnamed: 0,Actividad,Precio,Puntuación,Enlace,Fecha captura
28,Tour gastronómico por Múnich en grupo pequeño,292.0,,https://www.hellotickets.es/alemania/munich/to...,2024-10-20
41,Reserva con menú para el Hard Rock Cafe de Múnich,58.0,4.8,https://www.hellotickets.es/alemania/munich/re...,2024-10-20


In [47]:
avg_act_londres = round(actividades_londres["Precio"].mean(), 2)
avg_act_munich = round(actividades_munich["Precio"].mean(), 2)

In [74]:
avg_punt_act_londres = round(actividades_londres["Puntuación"].mean(), 2)
avg_punt_act_munich = round(actividades_munich["Puntuación"].mean(), 2)

dicc_punt_act_lon = {"Ciudad":"Londres",
                 "Puntuación":avg_punt_act_londres,
                 "Precio medio":avg_act_londres}
dicc_punt_act_mun = {"Ciudad":"Munich",
                 "Puntuación":avg_punt_act_munich,
                 "Precio medio":avg_act_munich}
lista_dicc_punt_act = [dicc_punt_act_lon,dicc_punt_act_mun]
df_punt_act_ciudad = pd.DataFrame(lista_dicc_punt_act)
df_punt_act_ciudad

Unnamed: 0,Ciudad,Puntuación,Precio medio
0,Londres,4.59,211.79
1,Munich,4.62,275.74


In [76]:
fig8 = px.bar(df_punt_act_ciudad, x='Ciudad', y=['Puntuación','Precio medio'],
             hover_data=['Precio medio'],
             text_auto=True,
             labels={"value":"Puntuación media"},
             title = "Puntuación media de actividades en Londres y Munich",
             height=400)
fig8.show()

In [53]:
dicc_londres = {"Ciudad":"Londres",
                "Vuelo":avg_vuelo_londres,
                "Hotel":avg_hotel_londres,
                "Actividades":avg_act_londres}
dicc_munich = {"Ciudad":"Munich",
                "Vuelo":avg_vuelo_munich,
                "Hotel":avg_hotel_munich,
                "Actividades":avg_act_munich}

lista_final_precios = [dicc_londres,dicc_munich]
df_precios = pd.DataFrame(lista_final_precios)


In [57]:
df_precios["Precio Total"] = df_precios.sum(axis=1, numeric_only=True)

In [58]:
df_precios

Unnamed: 0,Ciudad,Vuelo,Hotel,Actividades,Precio Total
0,Londres,430.52,482.74,211.79,1125.05
1,Munich,449.74,425.54,275.74,1151.02


In [64]:
df_precios_porc = round(df_precios[["Vuelo", "Hotel", "Actividades"]].div(df_precios["Precio Total"], axis=0) * 100,2)
df_precios_porc.columns = ["Vuelo %", "Hotel %", "Actividades %"]
df_precios_porc

Unnamed: 0,Vuelo %,Hotel %,Actividades %
0,38.27,42.91,18.82
1,39.07,36.97,23.96


In [65]:
pd.concat([df_precios, df_precios_porc], axis=1)

Unnamed: 0,Ciudad,Vuelo,Hotel,Actividades,Precio Total,Vuelo %,Hotel %,Actividades %
0,Londres,430.52,482.74,211.79,1125.05,38.27,42.91,18.82
1,Munich,449.74,425.54,275.74,1151.02,39.07,36.97,23.96


In [49]:
fig9 = px.bar(df_precios,
              x="Ciudad",
              y=["Vuelo","Hotel","Actividades"],
              title="Precio total de un viaje con origen MAD del 15 al 18 de Noviembre de 2024",
              text_auto=True,
              labels={"value":"Precio total"})

fig9.show()