In [1]:
import pandas as pd
import geopandas as gpd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.colors as colors
import contextily as ctx
import json
import base64
from io import BytesIO
from pyproj import Transformer
from shapely.geometry import LineString, box

In [2]:
# Número de filas a leer del archivo CSV
nrows = 100000
# Ruta del archivo CSV
filename = 'C:/Users/Álvaro/Documents/GitHub/TFG/TFG_TRACLUS/app/train_data/taxis_trajectory/train.csv'

In [3]:
def load_and_simplify_data(filename, rows, tolerance=0.001, umbral_distancia=0.01):
    # Cargar datos
    df = pd.read_csv(filename, nrows=rows, sep=",", low_memory=False)
    
    # Filtrar y crear LineString para cada polilínea
    def create_line(x):
        points = json.loads(x)
        if len(points) > 1:
            return LineString(points)
        return None
    
    df['geometry'] = df['POLYLINE'].apply(create_line)
    
    # Eliminar filas con geometrías nulas
    df = df[df['geometry'].notnull()]
    
    # Convertir a Geopandas DataFrame
    gdf = gpd.GeoDataFrame(df, geometry='geometry')
    
    # Simplificar las geometrías
    gdf['geometry'] = gdf['geometry'].simplify(tolerance)
    
    return gdf

In [4]:
def filter_data_in_area(gdf, minx, miny, maxx, maxy):
    # Crear un polígono de área de interés
    area_of_interest = box(minx, miny, maxx, maxy)
    
    # Filtrar los datos para incluir solo aquellos completamente dentro del área de interés
    gdf_filtered = gdf[gdf.geometry.within(area_of_interest)]
    
    return gdf_filtered

In [5]:
def lisr_coordinates(gdf):   
    # Crear listas vacías para las coordenadas x e y
    x_coords_flat = []
    y_coords_flat = []

    # Iterar sobre cada geometría en el GeoDataFrame
    for geom in gdf['geometry']:
        # Verificar que la geometría sea una LineString
        if isinstance(geom, LineString):
            # Iterar sobre cada punto en la LineString
            for point in geom.coords:
                x_coords_flat.append(point[0])  # Añadir la coordenada x a la lista
                y_coords_flat.append(point[1])  # Añadir la coordenada y a la lista
    
    return x_coords_flat, y_coords_flat

In [6]:
def map_ilustration(gdf, minx, miny, maxx, maxy):
    gdf = gdf.set_crs("EPSG:4326")

    # Luego, usar estas coordenadas en la función de filtrado
    gdf = filter_data_in_area(gdf, minx, miny, maxx, maxy)

    # Transforcion en EPSG:3857 para alinear con el mapa base de Contextily
    gdf = gdf.to_crs(epsg=3857)
    
    # Crear una figura con Matplotlib
    fig, ax = plt.subplots(figsize=(10, 10), dpi=300)
    gdf.plot(ax=ax, linewidth=0.5, color='blue')

    # Añadir un mapa base con Contextily
    ctx.add_basemap(ax, source=ctx.providers.CartoDB.Positron)

    # Añadir título y etiquetas
    plt.title('Mapa de Trayectorias de Taxis con Mapa de Fondo')
    plt.xlabel('Longitud')
    plt.ylabel('Latitud')

    # Crear un objeto BytesIO para guardar la imagen
    img_data = BytesIO()
    plt.savefig(img_data, format='png')
    img_data.seek(0)  # Mover el 'cursor' al principio del archivo en memoria
    
    # Es importante cerrar la figura para liberar memoria
    plt.close(fig)

    # Codificar la imagen generada en base64
    encoded_string = base64.b64encode(img_data.read()).decode('utf-8')

    return encoded_string

In [7]:
def map_heat(gdf, minx, miny, maxx, maxy, bin_count, posicion_x, posicion_y, zoom):  
    # Obtener las coordenadas x e y de las geometrías 
    x_coords_flat, y_coords_flat = lisr_coordinates(gdf)

    # Calcular el histograma bidimensional de las coordenadas x e y
    heatmap, _, _ = np.histogram2d(x_coords_flat, y_coords_flat, bins=bin_count, density=True, range=[[minx, maxx], [miny, maxy]])

    # Inicializar el transformador de coordenadas
    transformer = Transformer.from_crs("epsg:4326", "epsg:3857", always_xy=True)

    # Transformar las coordenadas
    xmin, ymin = transformer.transform(minx, miny)
    xmax, ymax = transformer.transform(maxx, maxy)
    
    """ # Calcular el centro y el rango de los ejes x e y
    x_center, y_center = ((xmin + xmax) / 2) + posicion_x, ((ymin + ymax) / 2) + posicion_y
    x_range, y_range = (xmax - xmin) / zoom, (ymax - ymin) / zoom """

    # Crear la figura y los ejes para matplotlib
    fig, ax = plt.subplots(figsize=(10, 10), dpi=300)

    # Crear una normalización logarítmica
    norm = colors.LogNorm(vmin=heatmap.min()+1, vmax=heatmap.max())

    # Mostrar el mapa de calor y capturar el objeto mappable retornado por imshow
    mappable = ax.imshow(heatmap.T, origin='lower', norm=norm ,extent=[xmin, xmax, ymin, ymax], aspect='auto', alpha=0.7, zorder=2)

    # Añadir el mapa base
    ctx.add_basemap(ax, source=ctx.providers.CartoDB.Positron, zoom='auto')

    """ # Ajustar los límites de los ejes para coincidir con los bordes del histograma
    ax.set_xlim(x_center - x_range, x_center + x_range)
    ax.set_ylim(y_center - y_range, y_center + y_range) """

    # Añadir barra de color, títulos y etiquetas usando el objeto mappable
    plt.colorbar(mappable, label='Densidad')
    plt.title('Mapa de Calor de Trayectorias de Taxis con Mapa de Fondo')
    plt.xlabel('Longitud')
    plt.ylabel('Latitud')

    # Crear un objeto BytesIO para guardar la imagen
    img_data = BytesIO()
    plt.savefig(img_data, format='png')
    img_data.seek(0)  # Mover el 'cursor' al principio del archivo en memoria
    
    # Es importante cerrar la figura para liberar memoria
    plt.close(fig)

    # Codificar la imagen generada en base64
    encoded_string = base64.b64encode(img_data.read()).decode('utf-8')

    return encoded_string

In [8]:
def solicitar_coordenadas(gdf):
    """ print("Por favor, introduce las coordenadas para el área de interés.")
    minx = float(input("Introduce la longitud mínima (minx): "))
    miny = float(input("Introduce la latitud mínima (miny): "))
    maxx = float(input("Introduce la longitud máxima (maxx): "))
    maxy = float(input("Introduce la latitud máxima (maxy): ")) """
    
    """ minx=-8.689
    miny=41.107
    maxx=-8.560
    maxy=41.185 """

    x_coords_flat, y_coords_flat = lisr_coordinates(gdf)

    maxx, maxy, minx, miny = max(x_coords_flat), max(y_coords_flat), min(x_coords_flat), min(y_coords_flat)

    return minx, miny, maxx, maxy 

In [9]:
# Esto aun no se como pedirlo o si hacerlo
def solicitar_map_position():
    bin_count = 300 # Cantidad de bins para el histograma 2D
    posicion_x = 0 # Coordenada x del centro del mapa, para despazarlo por el eje y, poner valore arededro de 1000
    posicion_y = 0 # Coordenada y del centro del mapa
    zoom = 2 # Nivel de zoom del mapa, por cuanto se divide las cordenadas

    return bin_count, posicion_x, posicion_y, zoom

In [10]:
# Cargar y simplificar datos
gdf = load_and_simplify_data(filename, nrows)

In [11]:
# solicitar coordenadas
minx, miny, maxx, maxy = solicitar_coordenadas(gdf)

# solicitar datos del mapa
bin_count, posicion_x, posicion_y, zoom = solicitar_map_position()

In [12]:
# Crear un mapa ilustrativo
html_map = map_ilustration(gdf, minx, miny, maxx, maxy)

# Crear un mapa de calor
html_heatmap = map_heat(gdf, minx, miny, maxx, maxy, bin_count, posicion_x, posicion_y, zoom)

# A partir de aqui empieza la plagina web, todo lo anterio estara en un archivo diferente en la implementacion final

In [13]:
import dash
import dash_bootstrap_components as dbc
from dash import Input, Output, html, dcc, State
import dash_html_components as html
# import io

The dash_html_components package is deprecated. Please replace
`import dash_html_components as html` with `from dash import html`
  import dash_html_components as html


In [14]:
# Selecciona un tema de Bootstrap
app = dash.Dash(__name__, external_stylesheets=[dbc.themes.LUMEN], suppress_callback_exceptions=True)

# LUMEN, MORPH

In [15]:
def get_map_image_as_html(html_map, html_heatmap):
    return html.Div([
            html.Div([
                html.Img(
                    src=f"data:image/png;base64,{html_map}",
                    style={
                        'maxHeight': '80vh',  # Altura máxima para evitar que la imagen sea demasiado alta
                        'width': '100%',      # Ancho ajustado al 100% del contenedor
                        'display': 'block',
                        'margin-left': 'auto',
                        'margin-right': 'auto'
                    }
                ),
            ], style={'flex': '1', 'display': 'flex', 'justifyCdef get_map_image_as_html(html_map, html_heatmap):ontent': 'center', 'alignItems': 'center', 'paddingRight': '5px'}),
            html.Div([
                html.Img(
                    src=f"data:image/png;base64,{html_heatmap}",
                    style={
                        'maxHeight': '80vh',  # Altura máxima para evitar que la imagen sea demasiado alta
                        'width': '100%',      # Ancho ajustado al 100% del contenedor
                        'display': 'block',
                        'margin-left': 'auto',
                        'margin-right': 'auto'
                    }
                ),
            ], style={'flex': '1', 'display': 'flex', 'justifyContent': 'center', 'alignItems': 'center', 'paddingLeft': '5px'})
        ], style={'display': 'flex', 'justifyContent': 'center', 'flexWrap': 'wrap'})

In [16]:
def get_home_page():
    return html.Div([
        dbc.NavbarSimple(
            html.Div([
            html.Div([
                dbc.Label("Choose latitud and longitud"),
                dbc.RadioItems(
                    options=[
                        {"label": "Option 1", "value": 1},
                        {"label": "Option 2", "value": 2},
                        {"label": "Option 3", "value": 3},
                    ],
                    value=1,
                    id="lat-long-radio-items",
                ), 
            ], style={'padding': '40px'}),
            html.Div([
                dbc.Label("Choose zoom and position of the map"),
                dbc.RadioItems(
                    options=[
                        {"label": "Option 1", "value": 1},
                        {"label": "Option 2", "value": 2},
                        {"label": "Option 3", "value": 3},
                    ],
                    value=1,
                    id="zoom-position-radio-items",
                ),
            ], style={'padding': '40px'}),
        ]),
        # brand_href="#",
        # color="pink",
        # dark=False
        ), 
        dcc.Loading(
            id="loading-1",
            type="default",
            children=html.Div(id="map-container")
        ),           
    ], style={'display': 'flex', 'justifyContent': 'space-around'})

In [17]:
""" def get_home_page():
    return html.Div([
        dbc.NavbarSimple(
            html.Div([
                html.Div([
                    dbc.Label("Choose latitud and longitud"),
                    dbc.RadioItems(
                        options=[
                            {"label": "Option 1", "value": 1},
                            {"label": "Option 2", "value": 2},
                            {"label": "Option 3", "value": 3},
                        ],
                        value=1,
                        id="lat-long-radio-items",
                    ), 
                ], style={'padding': '2vw'}),  # Uso de vw (viewport width) para el padding
                html.Div([
                    dbc.Label("Choose zoom and position of the map"),
                    dbc.RadioItems(
                        options=[
                            {"label": "Option 1", "value": 1},
                            {"label": "Option 2", "value": 2},
                            {"label": "Option 3", "value": 3},
                        ],
                        value=1,
                        id="zoom-position-radio-items",
                    ),
                ], style={'padding': '2vw'}),  # Uso de vw (viewport width) para el padding
            ], style={'display': 'flex', 'justifyContent': 'space-around', 'width': '100%'}),
        ), 
        dcc.Loading(
            html.Div(id="map-container")
        ),        
    ], style={'display': 'flex', 'justifyContent': 'space-around', 'flexWrap': 'wrap'}) """

' def get_home_page():\n    return html.Div([\n        dbc.NavbarSimple(\n            html.Div([\n                html.Div([\n                    dbc.Label("Choose latitud and longitud"),\n                    dbc.RadioItems(\n                        options=[\n                            {"label": "Option 1", "value": 1},\n                            {"label": "Option 2", "value": 2},\n                            {"label": "Option 3", "value": 3},\n                        ],\n                        value=1,\n                        id="lat-long-radio-items",\n                    ), \n                ], style={\'padding\': \'2vw\'}),  # Uso de vw (viewport width) para el padding\n                html.Div([\n                    dbc.Label("Choose zoom and position of the map"),\n                    dbc.RadioItems(\n                        options=[\n                            {"label": "Option 1", "value": 1},\n                            {"label": "Option 2", "value": 2},\n            

In [18]:
def get_clusters_map():
    return html.Div([
        dbc.Carousel(
            items=[
                {"key": "1", "src": f"data:image/png;base64,{html_heatmap}"},
                {"key": "2", "src": f"data:image/png;base64,{html_map}"}
            ],
            controls=True,
            indicators=True,
            variant="dark"
        )
    ],  style={'maxHeight': '80vh', 'width': '100%', 'display': 'block', 'margin-left': 'auto', 'margin-right': 'auto'})

In [19]:
def get_comparation_page():
    items1 = [
        dbc.DropdownMenuItem("Item 1", id="item-1-1"), 
        dbc.DropdownMenuItem("Item 2", id="item-1-2"),
        dbc.DropdownMenuItem("Item 3", id="item-1-3")
    ]

    items2 = [
        dbc.DropdownMenuItem("Item 1", id="item-2-1"), 
        dbc.DropdownMenuItem("Item 2", id="item-2-2"),
        dbc.DropdownMenuItem("Item 3", id="item-2-3")
    ]

    return html.Div([
        html.Div([
            dbc.DropdownMenu(
                items1, label="Primary", color="primary", className="m-1"
            ),
            dbc.DropdownMenu(
                items2, label="Secondary", color="secondary", className="m-1"
            ),
        ], style={'display': 'flex', 'justifyContent': 'center'}),
        html.Div([
            dcc.Loading(
                id="loading-cluster-1",
                type="default",
                children=html.Div(id="map-clusters-1")
            ),   
        ], style={'display': 'flex', 'justifyContent': 'center', 'alignItems': 'center', 'paddingRight': '5px'}),
        html.Div([
            dcc.Loading(
                id="loading-cluster-2",
                type="default",
                children=html.Div(id="map-clusters-2")
            )
        ], style={'display': 'flex', 'justifyContent': 'center', 'alignItems': 'center', 'paddingRight': '5px'}),
    ], style={'display': 'flex', 'justifyContent': 'center'})

In [20]:
def get_estadistic_page():
    # Convertir la geometría a WKT para una visualización amigable
    df = gdf.copy()
    df['geometry'] = df['geometry'].apply(lambda x: x.wkt)

    # Crear la tabla usando dbc.Table
    table_header = [
        html.Thead(html.Tr([html.Th(col) for col in df.columns]))
    ]

    table_body = [
        html.Tbody([html.Tr([html.Td(df.iloc[i][col]) for col in df.columns]) for i in range(min(len(df), 10))])
    ]

    return html.Div([
        dbc.Table(table_header + table_body, bordered=True, dark=True, hover=True, responsive=True, striped=True),
    ])


In [21]:
def get_page_zero():
    return html.Div([
        dbc.Container([
            html.H1("Introducción de datos previos", className="text-center mb-4"),  # Añadido margen inferior (mb-4)
            dbc.Row(
                dbc.Col([
                    html.H2("Archivo que se va a analizar:", className="text-center"),
                    dcc.Upload(
                        id='upload-data',
                        children=html.Div(['Arrastra o selecciona un archivo'], className="text-center"),
                        style={
                            'width': '100%', 'height': '60px', 'lineHeight': '60px',
                            'borderWidth': '1px', 'borderStyle': 'dashed', 'borderRadius': '5px',
                            'textAlign': 'center', 'margin': '10px auto', 'display': 'block'
                        },
                        className='mb-3',  # Añadido margen inferior
                    ),
                ], width=12)
            ),
            dbc.Row(
                dbc.Col([
                        html.H2("Número de trayectorias que se van a usar:", className="text-center"),
                        dcc.Input(
                            id='nrows-input', 
                            type='number', 
                            placeholder='Número de filas', 
                            value='',
                            className='form-control',  # Estilo de Bootstrap para inputs
                            style={'margin': '0 auto', 'width': '50%'},  # Centrar y ajustar ancho del input
                        )
                ], width=12, className="mb-3")  # Añadido margen inferior        
            ),
            dbc.Row(
                dbc.Col([
                        dbc.Button('Confirmar', id='confirm-button', n_clicks=0, className='me-2'),  # Botón con margen
                        dbc.Button('Configuración predeterminada', id='default-config-button', n_clicks=0),
                        html.Div(id='output-container', className='mt-3')  # Margen superior para el contenedor
                ], width=12, className='text-center')
            ),
        ], fluid=True)      
    ])


In [22]:
app.layout = html.Div([
    dcc.Location(id='url', refresh=False),
    dbc.Navbar(
        dbc.Container(children=[
            html.Div([
                dbc.NavbarBrand("TRACLUS", style={'color': 'white', 'fontSize': '50px'}),
            ], style={'width': '100%', 'display': 'flex', 'justify-content': 'center'}),
            html.Div([
                dbc.DropdownMenu(
                    label="Menú",
                    children=[
                        dbc.DropdownMenuItem("Inicio", href="/home"),
                        dbc.DropdownMenuItem("Comparación", href="/comparacion"),
                        dbc.DropdownMenuItem("Estadísticas", href="/estadisticas"),
                    ]
                ),
            ]),   
        ]),
            color="primary"
    ),
    
    dcc.Loading(
        dbc.Container(id='page-content', fluid=True)
    )
])


In [23]:
@app.callback(
    Output('page-content', 'children'), 
    [Input('url', 'pathname'),]
)

def display_page(pathname):
    if pathname == '/comparacion':
        return  get_comparation_page()
    elif pathname == '/estadisticas':
        return get_estadistic_page()
    elif pathname == '/home':  
        return get_home_page()
    else: # Incluyendo '/'
        return get_page_zero()


In [24]:
@app.callback(
    [Output('nrows-input', 'value'),
    Output('upload-data', 'children'),
    Output('output-container', 'children')],
    [Input('confirm-button', 'n_clicks'),
    Input('default-config-button', 'n_clicks')],
    [State('upload-data', 'contents'),
    State('nrows-input', 'value')]
)
def update_output(confirm_clicks, default_clicks, content, nrows):
    """ triggered_id = callback_context.triggered[0]['prop_id'].split('.')[0]
    if triggered_id == 'confirm-button' and content:
        content_type, content_string = content.split(',')

        decoded = base64.b64decode(content_string)
        try:
            if 'csv' in content_type:
                gdf = pd.read_csv(io.StringIO(decoded.decode('utf-8')), nrows=nrows)
            elif 'excel' in content_type:
                gdf = pd.read_excel(io.BytesIO(decoded), nrows=nrows)
        except Exception as e:
            print(e)
            return nrows, html.Div(['Arrastra o selecciona un archivo']), html.Div(['Hubo un error al procesar el archivo.'])
        
        return nrows, html.Div(['Arrastra o selecciona un archivo']), html.Div(['Archivo procesado correctamente.'])

    elif triggered_id == 'default-config-button':
        return html.Div(['Arrastra o selecciona un archivo']), html.Div(['Configuración restablecida a los valores predeterminados.'])

    return nrows, html.Div(['Arrastra o selecciona un archivo']), None """
    return None

In [25]:
@app.callback(
    Output('map-container', 'children'),
    [Input('lat-long-radio-items', 'value'),  # Escucha los cambios de latitud y longitud
    Input('zoom-position-radio-items', 'value')]  # Escucha los cambios de zoom y posición
)

def update_map(lat_long_value, zoom_position_value):
    # Aquí deberías decidir qué mapa mostrar basado en los valores seleccionados
    # Este es un pseudocódigo, necesitarás ajustar la lógica según tus datos y necesidades específicas
    if lat_long_value == 3:
        minx, miny, maxx, maxy = solicitar_coordenadas(gdf)
        # Define aquí cómo generas el mapa para la Opción 3
        map_image = get_map_image_as_html(map_ilustration(gdf, minx, miny, maxx, maxy), map_heat(gdf, minx, miny, maxx, maxy, bin_count, posicion_x, posicion_y, zoom))
    elif lat_long_value == 2:
        minx=-8.689
        miny=41.107
        maxx=-8.560
        maxy=41.185
        # Define aquí cómo generas el mapa para la Opción 2
        map_image = get_map_image_as_html(map_ilustration(gdf, minx, miny, maxx, maxy), map_heat(gdf, minx, miny, maxx, maxy, bin_count, posicion_x, posicion_y, zoom))
    else:
        # Define aquí cómo generas el mapa para la Opción 1
        map_image = get_map_image_as_html(html_map, html_heatmap)

    return [map_image]

In [26]:
@app.callback(
    Output('map-clusters-1', 'children'),
    [Input('item-1-1', 'n_clicks'),
    Input('item-1-2', 'n_clicks'),
    Input('item-1-3', 'n_clicks')]
)
def display_clusters_1(*args):
    ctx = dash.callback_context

    if not ctx.triggered:
        return get_clusters_map() # "Seleccione un elemento para el mapa 1."
    else:
        button_id = ctx.triggered[0]['prop_id'].split('.')[0]
        if button_id == 'item-1-1':
            return get_clusters_map()
        elif button_id == 'item-1-2':
            return get_clusters_map()
        elif button_id == 'item-1-3':
            return get_clusters_map()



In [27]:
@app.callback(
    Output('map-clusters-2', 'children'),
    [Input('item-2-1', 'n_clicks'),
    Input('item-2-2', 'n_clicks'),
    Input('item-2-3', 'n_clicks')]
)

def display_clusters_2(*args):
    ctx = dash.callback_context

    if not ctx.triggered:
        return get_clusters_map() # "Seleccione un elemento para el mapa 2."
    else:
        button_id = ctx.triggered[0]['prop_id'].split('.')[0]
        if button_id == 'item-2-1':
            return get_clusters_map()
        elif button_id == 'item-2-2':
            return get_clusters_map()
        elif button_id == 'item-2-3':
            return get_clusters_map()

In [28]:
# Ejecutar la aplicación
if __name__ == '__main__':
    app.run_server(debug=True, host='127.0.0.1', port=8050)
    # http://127.0.0.1:8050/

[1;31m---------------------------------------------------------------------------[0m
[1;31mSchemaTypeValidationError[0m                 Traceback (most recent call last)
File [1;32mc:\Users\Álvaro\AppData\Local\Programs\Python\Python311\Lib\site-packages\flask\app.py:870[0m, in [0;36mFlask.full_dispatch_request[1;34m(self=<Flask '__main__'>)[0m
[0;32m    868[0m     rv [38;5;241m=[39m [38;5;28mself[39m[38;5;241m.[39mpreprocess_request()
[0;32m    869[0m     [38;5;28;01mif[39;00m rv [38;5;129;01mis[39;00m [38;5;28;01mNone[39;00m:
[1;32m--> 870[0m         rv [38;5;241m=[39m [38;5;28;43mself[39;49m[38;5;241;43m.[39;49m[43mdispatch_request[49m[43m([49m[43m)[49m
        self [1;34m= <Flask '__main__'>[0m[1;34m
        [0mrv [1;34m= None[0m
[0;32m    871[0m [38;5;28;01mexcept[39;00m [38;5;167;01mException[39;00m [38;5;28;01mas[39;00m e:
[0;32m    872[0m     rv [38;5;241m=[39m [38;5;28mself[39m[38;5;241m.[39mhandle_user_exception(e)



Geometry column does not contain geometry.


Geometry column does not contain geometry.

