In [1]:
import pandas as pd
from geopy.geocoders import Photon
from geopy.geocoders import Nominatim
from unidecode import unidecode
import unidecode


In [2]:
import geopandas as gpd

In [3]:
import numpy as np
from shapely.geometry import Point, Polygon

import math



# Grid Shapes

Para crear un grid con polígonos geoespaciales y asignar a cada punto según su latitud y longitud a un polígono correspondiente, se puede utilizar la biblioteca geopandas en Python, que extiende las capacidades de pandas para trabajar con datos espaciales. También usaremos shapely para manipular y analizar datos geométricos planos, y numpy para manejar operaciones numéricas.

Primero, generamos un conjunto de polígonos que representen cada celda del grid sobre el área de interés (en este caso, México). Cada polígono puede ser identificado de manera única, por ejemplo, usando una convención de nomenclatura como PG1, PG2, etc.

### Tamaños del grid

    - Dimensiones del grid: 120, 10, -82, 37 (son las puntos cardinales que cubren el espacio donde se encuentra Mexico)
    
    - Tamaño de los poligonos que integran el grid:
    
CRS = EPSG:4326 para las coordenadas geográficas

Metros = epsg=6366 (10000) = 10km ¿Por que?

Usando "EPSG:4326", sacamos una aproximacion en metros para el tamaño de nuestros grids, directamente relacionada con las zonas a analizar.



In [None]:
def longitud_por_porcentaje_lat(latitud, porcentaje):
    """
    Calcula la longitud en metros de un porcentaje de 1 grado de longitud a una latitud dada.
    
    Args:
    latitud (float): La latitud en grados.
    porcentaje (float): El porcentaje de 1 grado de longitud. Por ejemplo, 0.5 para 50%, 0.6 para 60%.
    
    Returns:
    float: La longitud en metros del porcentaje dado de 1 grado de longitud en la latitud especificada.
    """
    # Convertir latitud a radianes
    lat_rad = math.radians(latitud)
    # Calcular longitud en km por grado de longitud
    longitud_km = math.cos(lat_rad) * 111.32
    # Convertir a metros y aplicar el porcentaje
    return longitud_km * 1000 * porcentaje

# Ejemplo de uso: Calcular el % de 1 grado de longitud en la latitud 10°
longitud_10_50porc = longitud_por_porcentaje_lat(10, .7)
# Ejemplo de uso: Calcular el % de 1 grado de longitud en la latitud 37°
longitud_37_50porc = longitud_por_porcentaje_lat(37, .7)

print(f"% de 1 grado de longitud a 10° latitud: {longitud_10_50porc:.2f} metros")
print(f"% de 1 grado de longitud a 37° latitud: {longitud_37_50porc:.2f} metros")


In [None]:
def longitud_por_porcentaje_latitud(porcentaje):
    """
    Calcula la longitud en metros de un porcentaje de 1 grado de latitud.
    
    Args:
    porcentaje (float): El porcentaje de 1 grado de latitud. Por ejemplo, 0.5 para 50%, 0.6 para 60%.
    
    Returns:
    float: La longitud en metros del porcentaje dado de 1 grado de latitud.
    """
    longitud_km_por_grado = 111  # Aproximadamente 111 km por grado de latitud
    return longitud_km_por_grado * 1000 * porcentaje  # Convertir a metros y aplicar el porcentaje

# Ejemplo de uso: Calcular el 50% de 1 grado de latitud
longitud_50porc_latitud = longitud_por_porcentaje_latitud(0.7)
# Ejemplo de uso: Calcular el 60% de 1 grado de latitud
longitud_60porc_latitud = longitud_por_porcentaje_latitud(0.7)

print(f"50% de 1 grado de latitud: {longitud_50porc_latitud:.2f} metros")
print(f"60% de 1 grado de latitud: {longitud_60porc_latitud:.2f} metros")


In [None]:
def crear_grid(xmin, xmax, ymin, ymax, ancho_celda, alto_celda):
    cols = list(np.arange(xmin, xmax, ancho_celda))
    rows = list(np.arange(ymin, ymax, alto_celda))
    poligonos = []
    ids = []

    id_contador = 1  # Iniciar contador para los ID de polígonos
    for x in cols:
        for y in rows:
            poligonos.append(Polygon([(x, y), (x+ancho_celda, y), (x+ancho_celda, y-alto_celda), (x, y-alto_celda)]))
            ids.append(f"PG{id_contador}")  # Asignar un ID único a cada polígono
            id_contador += 1

    grid = gpd.GeoDataFrame({'ID_Poligono': ids, 'geometry': poligonos})
    return grid

# Generar el grid con los límites aproximados de México y celdas de 1 grado por 1 grado

xmin, ymin, xmax, ymax = -120, 10, -82, 37

grid_1 = crear_grid(xmin, xmax, ymin, ymax, 1, 1)
grid_punto7 = crear_grid(xmin, xmax, ymin, ymax, .7, .7)

#Ahora, 'grid' es un GeoDataFrame que contiene el 'ID_Poligono' y su 'geometry'
print(grid_1.head())
print(grid_punto7.head())

In [None]:
# Guardar grid_1 como Shapefile
grid_1.to_file("/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/2. arcgis(general)/grids/grid_1x1.shp")

# Guardar grid_punto7 como Shapefile
grid_punto7.to_file("/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/2. arcgis(general)/grids/grid_punto7x7.shp")


In [None]:
# Definir las listas de estados para cada ruta, asegurándose de que todas las entradas están correctamente formateadas como strings
estados_ruta_golfo = ['Tabasco', 'Nuevo Leon', 'Veracruz', 'Tamaulipas']
estados_ruta_pacifico = ['Guerrero', 'Michoacan', 'Jalisco', 'Nayarit', 'Sinaloa', 'Sonora', 'Baja California', 'Baja California Sur','Colima']
estados_ruta_centro = ['San Luis Potosi','Estado de Mexico', 'Tlaxcala', 'Ciudad de Mexico', 'Puebla', 'Morelos', 'Hidalgo', 'Zacatecas', 'Durango', 'Chihuahua', 'Coahuila', 'Queretaro', 'Aguascalientes', 'Guanajuato']
ruta_sur = ['Chiapas', 'Oaxaca', 'Tabasco', 'Campeche', 'Quintana Roo', 'Yucatan']

# Actualizar la función para asignar la ruta basada en el estado
#def asignar_ruta(estado):
#    estado = estado.strip()  # Eliminar espacios en blanco al principio y al final
#    if estado in estados_ruta_golfo:
#        return 'Ruta del Golfo'
#    elif estado in estados_ruta_pacifico:
#        return 'Ruta del Pacifico'
#    elif estado in estados_ruta_centro:
#        return 'Ruta Centro'
#    elif estado in ruta_sur:
#        return 'Ruta Sur'
#    else:
#        return 'Ruta no identificada'  # Para estados que no coinciden con las listas

# Aplicar la función al DataFrame para crear una nueva columna 'Ruta'
#datos_csv['ruta'] = datos_csv['estado'].apply(asignar_ruta)

In [None]:
# Reordenar las columnas para colocar 'Estado' después de 'Ciudad'
#column_order = ['ciudad', 'estado', 'ruta','detenciones']

# Aplicar el nuevo orden de columnas al DataFrame
#datos_csv = datos_csv[column_order]

In [None]:
# Obtenemos los valores únicos de la columna 'ruta'
#valores_unicos_ruta = datos_csv['ruta'].unique()

# Imprimimos los valores únicos
#print(valores_unicos_ruta)

In [None]:
# Initialize the geolocator using OSM Nominatim
#geolocator = Photon(user_agent="measurement", timeout=10)

# Define a function to get latitude and longitude
#def get_lat_lon(address):
#    try:
#        location = geolocator.geocode(address)
#        if location:
#            return location.latitude, location.longitude
#        else:
#            return '', ''  # Return empty strings if location is not found
#    except AttributeError:
#        return '', ''

# Apply the function to the 'City' column and split the results into 'Latitude' and 'Longitude' columns
#datos_csv[['latitud', 'longitud']] = datos_csv['ciudad'].apply(lambda x: pd.Series(get_lat_lon(x)))

In [None]:
# Especifica la ruta donde deseas guardar el archivo CSV
#ruta_archivo_csv = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv'

# Guardar el DataFrame en el archivo CSV especificado
#datos_csv.to_csv(ruta_archivo_csv, index=False)

#print(f"El DataFrame ha sido guardado exitosamente en: {ruta_archivo_csv}")


In [None]:
# Cargar el archivo CSV
#datos_csv1 = pd.read_csv('/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv')


In [None]:
# Convertir la columna 'detenciones' a entero
#datos_csv1['detenciones'] = pd.to_numeric(datos_csv1['detenciones'], errors='coerce').fillna(0).astype(int)

In [None]:
# Identificar los índices de la primera fila de cada categoría en 'estado'
#indices_a_eliminar = datos_csv1.groupby('estado').head(1).index

# Eliminar esas filas del DataFrame
#datos_csv1 = datos_csv1.drop(indices_a_eliminar)




In [None]:
# Verificar los cambios
#print(datos_csv1.head())


In [None]:
# Agregar la columna 'tipo' con la etiqueta 'Presencia Migración Irregular' para todas las filas
#datos_csv1['tipo'] = 'Presencia Migración Irregular'

# Verificar los cambios mostrando las primeras filas del DataFrame
#print(datos_csv1.head())


In [None]:
# Especifica la ruta donde deseas guardar el archivo CSV
#ruta_archivo_csv1 = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv'

# Guardar el DataFrame en el archivo CSV especificado
#datos_csv1.to_csv(ruta_archivo_csv1, index=False)

#print(f"El DataFrame ha sido guardado exitosamente en: {ruta_archivo_csv1}")


### Grid Shape

Para crear un grid con polígonos geoespaciales y asignar a cada punto según su latitud y longitud a un polígono correspondiente, se puede utilizar la biblioteca geopandas en Python, que extiende las capacidades de pandas para trabajar con datos espaciales. También usaremos shapely para manipular y analizar datos geométricos planos, y numpy para manejar operaciones numéricas.



Crear el Grid de Polígonos: Primero, generamos un conjunto de polígonos que representen cada celda del grid sobre el área de interés (en este caso, México). Cada polígono puede ser identificado de manera única, por ejemplo, usando una convención de nomenclatura como PG1, PG2, etc.

In [None]:
def crear_grid(xmin, xmax, ymin, ymax, ancho_celda, alto_celda):
    cols = list(np.arange(xmin, xmax, ancho_celda))
    rows = list(np.arange(ymin, ymax, alto_celda))
    poligonos = []
    ids = []

    id_contador = 1  # Iniciar contador para los ID de polígonos
    for x in cols:
        for y in rows:
            poligonos.append(Polygon([(x, y), (x+ancho_celda, y), (x+ancho_celda, y-alto_celda), (x, y-alto_celda)]))
            ids.append(f"PG{id_contador}")  # Asignar un ID único a cada polígono
            id_contador += 1

    grid = gpd.GeoDataFrame({'ID_Poligono': ids, 'geometry': poligonos})
    return grid

# Generar el grid con los límites aproximados de México y celdas de 1 grado por 1 grado
xmin, ymin, xmax, ymax = -120, 10, -82, 37
grid = crear_grid(xmin, xmax, ymin, ymax, 1, 1)

 Ahora, 'grid' es un GeoDataFrame que contiene el 'ID_Poligono' y su 'geometry'
#print(grid.head())

In [None]:
# Cargar el archivo CSV
#datos_csv1 = pd.read_csv('/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv')


In [None]:
# Actualizar Campeche, Campeche
datos_csv1.loc[(datos_csv1['ciudad'] == 'Campeche, Campeche'), 'latitud'] = 19.830285751988043
datos_csv1.loc[(datos_csv1['ciudad'] == 'Campeche, Campeche'), 'longitud'] = -90.53551463998544

# Actualizar Colima, Colima
datos_csv1.loc[(datos_csv1['ciudad'] == 'Colima, Colima'), 'latitud'] = 19.24487815537049
datos_csv1.loc[(datos_csv1['ciudad'] == 'Colima, Colima'), 'longitud'] = -103.7250306766154

# Actualizar Puebla, Puebla
datos_csv1.loc[(datos_csv1['ciudad'] == 'Puebla, Puebla'), 'latitud'] = 19.038406227976886
datos_csv1.loc[(datos_csv1['ciudad'] == 'Puebla, Puebla'), 'longitud'] = -98.2069491554557


datos_csv1.loc[(datos_csv1['ciudad'] == 'Zacatecas, Zacatecas'), 'latitud'] = 19.039018782328817
datos_csv1.loc[(datos_csv1['ciudad'] == 'Zacatecas, Zacatecas'), 'longitud'] = -98.20248616428334

In [None]:
datos_csv1.head(30)

In [None]:
# Eliminar las columnas del DataFrame
#datos_csv1 = datos_csv1.drop(columns=['ID_Poligono','geometry', 'codigo_ruta', 'contador_xy', 'codigo_unico'])

# Verificación: Muestra las primeras filas para asegurarse de que las columnas han sido eliminadas
#print(datos_csv1.head())


In [None]:
# Convertir la columna 'detenciones' a entero
#datos_csv1['detenciones'] = pd.to_numeric(datos_csv1['detenciones'], errors='coerce').fillna(0).astype(int)

In [None]:
# Paso 2: Asignar Puntos a Polígonos
puntos = [Point(xy) for xy in zip(datos_csv1.longitud, datos_csv1.latitud)]
geo_df = gpd.GeoDataFrame(datos_csv1, geometry=puntos)

# Realizar la asignación
geo_df = gpd.sjoin(geo_df, grid, how='left', op='within')

# Paso 3: Actualizar DataFrame
datos_csv1['ID_Poligono'] = geo_df['ID_Poligono']

In [None]:
# Asegurándose de que datos_csv2 es un GeoDataFrame
if not isinstance(datos_csv1, gpd.GeoDataFrame):
    # Si datos_csv2 ya tiene una columna 'geometry', úsala; de lo contrario, se necesita definir una
    if 'geometry' in datos_csv1.columns:
        datos_csv1 = gpd.GeoDataFrame(datos_csv1, geometry='geometry')
    else:
        # Aquí se asume que no hay una columna 'geometry' existente y que quizás no necesites definir una en este momento
        datos_csv1 = gpd.GeoDataFrame(datos_csv1)

# Realizar el merge (unión) entre datos_csv2 y grid usando 'ID_Poligono' como clave
datos_csv1 = datos_csv1.merge(grid[['ID_Poligono', 'geometry']], on='ID_Poligono', how='left')


In [None]:
datos_csv1.tail(20)

Asignar Puntos a Polígonos: Luego, para cada punto dado por sus coordenadas de latitud y longitud en datos_csv1, determinamos en qué polígono del grid se encuentra y asignamos el identificador de ese polígono al punto.


el codigo de un punto se miraria algo asi: S-PG#-1

Para asignar un código que combine el código de ruta por estado, el identificador del polígono al que pertenece cada punto y un número ascendente basado en el orden de las coordenadas XY dentro de cada polígono

por estado, si:
    'Ruta Sur': 'S',
    'Ruta del Pacifico': 'P',
    'Ruta Centro': 'C',
    'Ruta del Golfo': 'G'
    
por ID_Poligono: el poligono a que pertenece

y por orden asendientes de su coordenada xy dentro de cada poligono

In [None]:
# Primero, mapeamos la columna 'ruta' a su código correspondiente
ruta_to_code = {
    'Ruta Sur': 'S',
    'Ruta del Pacifico': 'P',
    'Ruta Centro': 'C',
    'Ruta del Golfo': 'G'
}
datos_csv1['codigo_ruta'] = datos_csv1['ruta'].map(ruta_to_code)

# Asumiendo que 'datos_csv2' ya tiene una columna 'ID_Poligono',
# vamos a crear una columna que identifique el orden XY dentro de cada polígono
# Para esto, primero ordenamos el DataFrame
datos_csv1.sort_values(by=['ID_Poligono', 'latitud', 'longitud'], ascending=[True, True, True], inplace=True)

# Creamos una nueva columna que será el contador dentro de cada grupo de 'ID_Poligono'
datos_csv1['contador_xy'] = datos_csv1.groupby('ID_Poligono').cumcount() + 1

# Ahora, combinamos todo para crear el código único
datos_csv1['codigo_unico'] = datos_csv1['codigo_ruta'] + '-' + datos_csv1['ID_Poligono'] + '-' + datos_csv1['contador_xy'].astype(str)

# Revisamos el resultado
print(datos_csv1[['ciudad', 'estado', 'ruta', 'ID_Poligono', 'codigo_unico']])


Actualizar DataFrame: Finalmente, agregamos una nueva columna al DataFrame datos_csv1 para almacenar el identificador del polígono del grid al que pertenece cada punto.

In [None]:
# Obtener el conteo de los valores únicos en la columna 'ID_Poligono'
conteo_id_poligono = datos_csv1['ID_Poligono'].value_counts()

# Mostrar el conteo
print(conteo_id_poligono)



In [None]:
# Especifica la ruta donde deseas guardar el archivo CSV
ruta_archivo_csv4 = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/grid.csv'

# Guardar el DataFrame en el archivo CSV especificado
grid.to_csv(ruta_archivo_csv4, index=False)

print(f"El DataFrame ha sido guardado exitosamente en: {ruta_archivo_csv3}")

In [None]:
grid

In [None]:
datos_csv2

### Arreglamos detenciones

reordenar mi df datos_csv2, usando su columna estado, sort en orden alfabetico y resetear el index

In [None]:
# Cargar el archivo CSV
datos_csv2 = pd.read_csv('/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv')


In [None]:
# Ordenamos el DataFrame por la columna 'estado' en orden alfabético
datos_csv2_ordenado = datos_csv2.sort_values(by='estado')

# Reseteamos el índice del DataFrame ordenado
datos_csv2_ordenado.reset_index(drop=True, inplace=True)



In [None]:
# Especifica la ruta donde deseas guardar el archivo CSV
ruta_archivo_csv5 = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv'

# Guardar el DataFrame en el archivo CSV especificado
datos_csv2_ordenado.to_csv(ruta_archivo_csv5, index=False)

print(f"El DataFrame ha sido guardado exitosamente en: {ruta_archivo_csv5}")

In [None]:
# Cargar el archivo CSV
datos_csv3 = pd.read_csv('/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv')


#### AGREGamos columna con los datos de detenciones, procesamos y unimos

In [None]:
# Cargar el archivo CSV
datos_detenciones_2023 = pd.read_csv('/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones.csv')


In [None]:
datos_detenciones_2023 = datos_detenciones_2023.dropna()

In [None]:
datos_detenciones_2023.head()

In [None]:
# Cambiamos los nombres de las columnas usando el método 'rename'
datos_detenciones_2023 = datos_detenciones_2023.rename(columns={'Unnamed: 0': 'ciudad', 'Unnamed: 1': 'detenciones'})



In [None]:
# Función para eliminar acentos en una cadena de texto, manejando valores no-cadena
def quitar_acentos(texto):
    # Si el valor es una cadena, aplicamos unidecode
    if isinstance(texto, str):
        return unidecode.unidecode(texto)
    # Si no es una cadena, lo dejamos tal cual (esto incluye NaN y números)
    return texto

# Aplicamos la función a todas las columnas de tipo object en el DataFrame
for columna in datos_detenciones_2023.select_dtypes(include=['object']).columns:
    datos_detenciones_2023[columna] = datos_detenciones_2023[columna].apply(quitar_acentos)



In [None]:
# Función para detectar si un nombre de ciudad tiene caracteres especiales (no es alfanumérico)
def tiene_caracteres_especiales(cadena):
    return not cadena.replace(" ", "").isalnum()

# Crea una nueva columna 'estado' inicialmente llena con NaN
datos_detenciones_2023['estado'] = pd.NA

# Inicializamos una variable para almacenar el estado actual mientras iteramos
estado_actual = None

# Iteramos sobre las filas del DataFrame
for index, row in datos_detenciones_2023.iterrows():
    # Si la ciudad no tiene caracteres especiales, actualizamos estado_actual
    if not tiene_caracteres_especiales(row['ciudad']):
        estado_actual = row['ciudad']
    # Asignamos el estado actual a la columna 'estado'
    datos_detenciones_2023.at[index, 'estado'] = estado_actual

In [None]:
# Filtramos el DataFrame para mantener solo las filas donde la columna 'ciudad' tiene caracteres especiales
datos_detenciones_2023 = datos_detenciones_2023[datos_detenciones_2023['ciudad'].apply(tiene_caracteres_especiales)]


In [None]:
# Asegúrate de que 'datos_detenciones_2023' es el DataFrame actual después de eliminar las filas con NaN.
datos_detenciones_2023 = datos_detenciones_2023[['ciudad', 'estado', 'detenciones']]


In [None]:
# Reemplazamos el contenido de la columna 'ciudad' después de la primera coma por el valor de la columna 'estado'
datos_detenciones_2023['ciudad'] = datos_detenciones_2023.apply(lambda fila: fila['ciudad'].split(',', 1)[0] + ", " + fila['estado'], axis=1)


In [None]:
# Verificamos el cambio
print(datos_detenciones_2023.head(20))

In [None]:
# Especifica la ruta donde deseas guardar el archivo CSV
ruta_archivo_csv6 = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_2023.csv'

# Guardar el DataFrame en el archivo CSV especificado
datos_detenciones_2023.to_csv(ruta_archivo_csv6, index=False)

print(f"El DataFrame ha sido guardado exitosamente en: {ruta_archivo_csv6}")

In [None]:
# Realizamos un merge entre datos_csv3 y datos_detenciones_2023 basándonos en 'ciudad'
datos_combinados = pd.merge(datos_csv3, datos_detenciones_2023[['ciudad', 'detenciones']],
                            on='ciudad', how='left', suffixes=('', '_nueva'))


In [None]:
# Actualizamos la columna 'detenciones' en datos_csv3 con los valores de 'detenciones_nueva'
datos_csv3['detenciones'] = datos_combinados['detenciones_nueva']


In [None]:
# Verificamos el cambio
print(datos_csv3.head())

In [None]:
# Especifica la ruta donde deseas guardar el archivo CSV
ruta_archivo_csv7 = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_1.csv'

# Guardar el DataFrame en el archivo CSV especificado
datos_csv3.to_csv(ruta_archivo_csv7, index=False)

print(f"El DataFrame ha sido guardado exitosamente en: {ruta_archivo_csv7}")

### Hacemos segundo df con geometry_range

In [None]:
datos_csv3.head()

In [None]:
# Seleccionamos las columnas específicas de datos_csv3
datos_csv4 = datos_csv3[['ciudad', 'estado', 'ruta', 'detenciones', 'latitud', 'longitud', 'tipo', 'ID_Poligono', 'codigo_unico']].copy()

# Reseteamos el índice del nuevo DataFrame
datos_csv3.reset_index(drop=True, inplace=True)

# Verificamos el resultado
print(datos_csv4.head())


In [None]:
# Asegurándonos de trabajar con el DataFrame correcto, df1
gdf = gpd.GeoDataFrame(datos_csv4, geometry=gpd.points_from_xy(datos_csv4.longitud, datos_csv4.latitud))

# Estableciendo el CRS original a EPSG:4326 para las coordenadas geográficas
gdf.crs = "EPSG:4326"

# Cambiando el CRS a uno que use metros para el cálculo del buffer. Reemplazando el EPSG con un código correcto.
# Nota: El EPSG 6366 parece ser un error. Asegúrate de usar el código EPSG de UTM adecuado para tu zona.
gdf_metros = gdf.to_crs(epsg=6366)  # Reemplaza YOUR_UTM_EPSG_CODE con el código EPSG adecuado

# Aplicando el buffer de 10km para crear una nueva columna 'geometry_range' con los polígonos
gdf_metros['geometry_range'] = gdf_metros.geometry.buffer(10000)

# (Opcional) Si deseas convertir el GeoDataFrame de regreso a lat/long (EPSG:4326) para alguna otra operación,
# y quieres que la columna 'geometry_range' sea la geometría activa,
# debes hacerlo antes de cambiar el CRS de regreso a EPSG:4326.
# gdf_metros.set_geometry('geometry_range', inplace=True)

# Cambiando de regreso a EPSG:4326
gdf_final = gdf_metros.to_crs(epsg=4326)

In [None]:
gdf_final

In [None]:
# Especifica la ruta donde deseas guardar el archivo CSV
ruta_archivo_csv7 = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/3. mapas/1. Mapas/Metodo_1/ciudades_rutas/ciudades detenciones/ciudades_detenciones_geometry_range.csv'

# Guardar el DataFrame en el archivo CSV especificado
gdf_final.to_csv(ruta_archivo_csv6, index=False)

print(f"El DataFrame ha sido guardado exitosamente en: {ruta_archivo_csv7}")

### Actualizacion de grids, join con eventos


In [4]:
# Cargar el archivo CSV
grid7x7 = gpd.read_file('/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/2. arcgis(general)/grids/grid7x7/grid_punto7x7.shp')


In [5]:
grid7x7

Unnamed: 0,ID_Poligon,geometry
0,PG1,"POLYGON ((-120.00000 10.00000, -119.30000 10.0..."
1,PG2,"POLYGON ((-120.00000 10.70000, -119.30000 10.7..."
2,PG3,"POLYGON ((-120.00000 11.40000, -119.30000 11.4..."
3,PG4,"POLYGON ((-120.00000 12.10000, -119.30000 12.1..."
4,PG5,"POLYGON ((-120.00000 12.80000, -119.30000 12.8..."
...,...,...
2140,PG2141,"POLYGON ((-82.20000 33.80000, -81.50000 33.800..."
2141,PG2142,"POLYGON ((-82.20000 34.50000, -81.50000 34.500..."
2142,PG2143,"POLYGON ((-82.20000 35.20000, -81.50000 35.200..."
2143,PG2144,"POLYGON ((-82.20000 35.90000, -81.50000 35.900..."


In [13]:
# Renombramos la columna 'ID_Poligon' a 'ID_Poligono' en el GeoDataFrame grid7x7
grid7x7.rename(columns={'ID_Poligon': 'ID_Poligono'}, inplace=True)

# Verificamos que el cambio se haya realizado correctamente
print(grid7x7.columns)


Index(['ID_Poligono', 'geometry'], dtype='object')


In [17]:
# Especifica la ruta donde deseas guardar el archivo shapefile
ruta_archivo_shp = '/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/2. arcgis(general)/grids/grid7x7/grid_punto7x7.shp'

# Guardar el GeoDataFrame en el archivo shapefile especificado
grid7x7.to_file(ruta_archivo_shp, index=False)

print(f"El GeoDataFrame ha sido guardado exitosamente en: {ruta_archivo_shp}")


  grid7x7.to_file(ruta_archivo_shp, index=False)


El GeoDataFrame ha sido guardado exitosamente en: /Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/2. arcgis(general)/grids/grid7x7/grid_punto7x7.shp


In [26]:
dfvalores = pd.read_csv('/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/1. Mapas/Metodo_1/df_valores_rutas.csv')


In [27]:
dfvalores

Unnamed: 0,nombre,ciudad,estado,latitud,longitud,codigo_ruta,ID_Poligono,codigo_unico,eventos,eventos_in_grid,inm_30km,inm_in_grid,inm_in_estado,sc_30km,sc_in_grid,sc_in_estado
0,"Tapachula, Chiapas","Tapachula, Chiapas",Chiapas,14.904291,-92.260926,S,PG1530,S-PG1530-8,98486,142180,2,4,13,17,11,35
1,"Huimanguillo, Tabasco","Huimanguillo, Tabasco",Tabasco,17.762097,-93.663441,G,PG1456,G-PG1456-1,97523,97523,0,0,3,0,0,0
2,"Centro, Tabasco","Centro, Tabasco",Tabasco,18.027159,-92.774791,G,PG1495,G-PG1495-6,71661,92612,1,1,3,0,0,0
3,"Acayucan, Veracruz","Acayucan, Veracruz",Veracruz,17.948786,-94.914575,G,PG1378,G-PG1378-4,45794,45863,1,1,3,2,2,12
4,"Tenosique, Tabasco","Tenosique, Tabasco",Tabasco,17.470713,-91.422021,G,PG1572,G-PG1572-3,40069,55739,1,2,3,2,5,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
384,"San Juan Huactzinco, Tlaxcala","San Juan Huactzinco, Tlaxcala",Tlaxcala,19.232933,-98.252038,C,PG1224,C-PG1224-2,1,5419,2,1,0,8,3,0
385,"Amaxac de Guerrero, Tlaxcala","Amaxac de Guerrero, Tlaxcala",Tlaxcala,19.348889,-98.167778,C,PG1224,C-PG1224-12,1,5419,1,1,0,3,3,0
386,"Chicomuselo, Chiapas","Chicomuselo, Chiapas",Chiapas,15.793552,-92.419266,S,PG1531,S-PG1531-1,1,1317,0,4,13,0,2,35
387,"Carlos A. Carrillo, Veracruz","Carlos A. Carrillo, Veracruz",Veracruz,18.328361,-95.715403,G,PG1339,G-PG1339-4,1,3222,0,0,3,0,0,12


#### cinturon de control migratorio


In [28]:
data = {
    'codigo_unico': [
        'S-PG1529-1', 'S-PG1530-8', 'S-PG1530-5', 'S-PG1530-4', 'S-PG1530-2',
        'S-PG1492-2', 'S-PG1453-1', 'S-PG1454-3', 'S-PG1493-3', 'G-PG1456-1',
        'G-PG1495-1', 'G-PG1494-3', 'G-PG1494-4', 'G-PG1495-5', 'G-PG1495-6',
        'G-PG1534-2', 'S-PG1572-1', 'S-PG1572-1', 'G-PG1572-3', 'G-PG1573-1',
        'S-PG1613-1', 'S-PG1614-1', 'S-PG1654-1', 'S-PG1694-1', 'S-PG1850-1'
    ],
    'Orden': [
        1, 2, 3, 4, 5,
        6, 7, 8, 9, 10,
        11, 12, 13, 14, 15,
        16, 17, 18, 19, 20,
        21, 22, 23, 24, 25
    ]
}

cinturon = pd.DataFrame(data)
print(cinturon)

   codigo_unico  Orden
0    S-PG1529-1      1
1    S-PG1530-8      2
2    S-PG1530-5      3
3    S-PG1530-4      4
4    S-PG1530-2      5
5    S-PG1492-2      6
6    S-PG1453-1      7
7    S-PG1454-3      8
8    S-PG1493-3      9
9    G-PG1456-1     10
10   G-PG1495-1     11
11   G-PG1494-3     12
12   G-PG1494-4     13
13   G-PG1495-5     14
14   G-PG1495-6     15
15   G-PG1534-2     16
16   S-PG1572-1     17
17   S-PG1572-1     18
18   G-PG1572-3     19
19   G-PG1573-1     20
20   S-PG1613-1     21
21   S-PG1614-1     22
22   S-PG1654-1     23
23   S-PG1694-1     24
24   S-PG1850-1     25


In [30]:
# Suponiendo que tienes los DataFrames df_cinturon y df_valores ya definidos

# Merge utilizando la columna "codigo_unico"
df_cinturon = pd.merge(cinturon, dfvalores, on='codigo_unico')

# Imprimir el resultado
print(df_cinturon)


   codigo_unico  Orden                             nombre  \
0    S-PG1529-1      1                  Suchiate, Chiapas   
1    S-PG1530-8      2                 Tapachula, Chiapas   
2    S-PG1530-5      3                 Huehuetan, Chiapas   
3    S-PG1530-4      4                   Huixtla, Chiapas   
4    S-PG1530-2      5         Villa Comaltitlan, Chiapas   
5    S-PG1492-2      6                Pijijiapan, Chiapas   
6    S-PG1453-1      7                   Arriaga, Chiapas   
7    S-PG1454-3      8  Ocozocoautla de Espinosa, Chiapas   
8    S-PG1493-3      9          Tuxtla Gutierrez, Chiapas   
9    G-PG1456-1     10              Huimanguillo, Tabasco   
10   G-PG1495-1     11                  Cardenas, Tabasco   
11   G-PG1494-3     12                     Teapa, Tabasco   
12   G-PG1494-4     13                 Tacotalpa, Tabasco   
13   G-PG1495-5     14                    Jalapa, Tabasco   
14   G-PG1495-6     15                    Centro, Tabasco   
15   G-PG1534-2     16  

In [31]:
# Suponiendo que tienes el DataFrame df_cinturon ya definido

# Cambiar los tipos de datos de las columnas 'eventos' y 'eventos_in_grid'
df_cinturon['eventos'] = df_cinturon['eventos'].astype(int)
df_cinturon['eventos_in_grid'] = df_cinturon['eventos_in_grid'].astype(int)

# Escribir el DataFrame en un archivo CSV
path = "/Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/1. Mapas/Metodo_1/estaciones INM/df_cinturon.csv"
df_cinturon.to_csv(path, index=False)

print("DataFrame guardado como CSV en:", path)


DataFrame guardado como CSV en: /Users/pablouriarte/Documents/1. Expediente Tec de Monterrey/1.Tesis/Mapa_Migracion_Irregular_Mexico/1. Mapas/1. Mapas/Metodo_1/estaciones INM/df_cinturon.csv


In [8]:
# Renombrar las columnas que contienen la palabra 'detenciones'
#dfvalores = dfvalores.rename(columns=lambda x: x.replace('detenciones', 'eventos'))

# Verificamos los nuevos nombres de las columnas
#print(dfvalores.columns)


Index(['nombre', 'ciudad', 'estado', 'latitud', 'longitud', 'codigo_ruta',
       'ID_Poligono', 'codigo_unico', 'eventos', 'eventos_in_grid', 'inm_30km',
       'inm_in_grid', 'inm_in_estado', 'sc_30km', 'sc_in_grid',
       'sc_in_estado'],
      dtype='object')


In [14]:
# Calculamos la suma de eventos para cada 'ID_Poligono'
sum_eventos = dfvalores.groupby('ID_Poligono')['eventos'].transform('sum')

# Contamos el número de ocurrencias de cada 'ID_Poligono'
count_eventos = dfvalores.groupby('ID_Poligono')['eventos'].transform('count')

# Calculamos el promedio de eventos y creamos la nueva columna 'eventos_promedio_grid'
dfvalores['eventos_promedio_grid'] = sum_eventos / count_eventos

# Mostramos las primeras filas del DataFrame para verificar
print(dfvalores.head())


                  nombre                 ciudad    estado    latitud  \
0     Tapachula, Chiapas     Tapachula, Chiapas   Chiapas  14.904291   
1  Huimanguillo, Tabasco  Huimanguillo, Tabasco   Tabasco  17.762097   
2        Centro, Tabasco        Centro, Tabasco   Tabasco  18.027159   
3     Acayucan, Veracruz     Acayucan, Veracruz  Veracruz  17.948786   
4     Tenosique, Tabasco     Tenosique, Tabasco   Tabasco  17.470713   

    longitud codigo_ruta ID_Poligono codigo_unico  eventos  eventos_in_grid  \
0 -92.260926           S      PG1530   S-PG1530-8    98486           142180   
1 -93.663441           G      PG1456   G-PG1456-1    97523            97523   
2 -92.774791           G      PG1495   G-PG1495-6    71661            92612   
3 -94.914575           G      PG1378   G-PG1378-4    45794            45863   
4 -91.422021           G      PG1572   G-PG1572-3    40069            55739   

   inm_30km  inm_in_grid  inm_in_estado  sc_30km  sc_in_grid  sc_in_estado  \
0         2   

In [15]:
# Realizamos el merge con el DataFrame dfvalores usando 'ID_Poligono' como clave
merged_grid = grid7x7.merge(dfvalores[['ID_Poligono', 'eventos_promedio_grid']], on='ID_Poligono', how='left')

# Reemplazamos los valores NaN por 0
merged_grid['eventos_promedio_grid'].fillna(0, inplace=True)

# Convertimos la columna 'eventos_promedio_grid' a un tipo numérico
# Usamos 'coerce' para manejar cualquier valor no numérico y convertirlo en NaN, luego reemplazarlos por 0
merged_grid['eventos_promedio_grid'] = pd.to_numeric(merged_grid['eventos_promedio_grid'], errors='coerce').fillna(0)

# Verificamos los tipos de datos y mostramos las primeras filas para confirmar
print(merged_grid.dtypes)

ID_Poligono                object
geometry                 geometry
eventos_promedio_grid     float64
dtype: object
  ID_Poligono                                           geometry  \
0         PG1  POLYGON ((-120.00000 10.00000, -119.30000 10.0...   
1         PG2  POLYGON ((-120.00000 10.70000, -119.30000 10.7...   
2         PG3  POLYGON ((-120.00000 11.40000, -119.30000 11.4...   
3         PG4  POLYGON ((-120.00000 12.10000, -119.30000 12.1...   
4         PG5  POLYGON ((-120.00000 12.80000, -119.30000 12.8...   

   eventos_promedio_grid  
0                    0.0  
1                    0.0  
2                    0.0  
3                    0.0  
4                    0.0  


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  merged_grid['eventos_promedio_grid'].fillna(0, inplace=True)


In [19]:
merged_grid.head()

Unnamed: 0,ID_Poligono,geometry,eventos_promedio_grid
0,PG1,"POLYGON ((-120.00000 10.00000, -119.30000 10.0...",0.0
1,PG2,"POLYGON ((-120.00000 10.70000, -119.30000 10.7...",0.0
2,PG3,"POLYGON ((-120.00000 11.40000, -119.30000 11.4...",0.0
3,PG4,"POLYGON ((-120.00000 12.10000, -119.30000 12.1...",0.0
4,PG5,"POLYGON ((-120.00000 12.80000, -119.30000 12.8...",0.0


In [21]:
# Ordenamos el DataFrame 'merged_grid' por 'eventos_promedio_grid' de forma ascendente
merged_grid_sorted = merged_grid.sort_values(by='eventos_promedio_grid', ascending=False)



In [22]:
# Mostramos las filas ordenadas
merged_grid_sorted

Unnamed: 0,ID_Poligono,geometry,eventos_promedio_grid
1647,PG1456,"POLYGON ((-94.10000 18.40000, -93.40000 18.400...",97523.000000
1797,PG1572,"POLYGON ((-92.00000 17.70000, -91.30000 17.700...",18579.666667
1796,PG1572,"POLYGON ((-92.00000 17.70000, -91.30000 17.700...",18579.666667
1795,PG1572,"POLYGON ((-92.00000 17.70000, -91.30000 17.700...",18579.666667
1739,PG1530,"POLYGON ((-92.70000 15.60000, -92.00000 15.600...",15797.777778
...,...,...,...
755,PG753,"POLYGON ((-106.70000 17.70000, -106.00000 17.7...",0.000000
754,PG752,"POLYGON ((-106.70000 17.00000, -106.00000 17.0...",0.000000
753,PG751,"POLYGON ((-106.70000 16.30000, -106.00000 16.3...",0.000000
752,PG750,"POLYGON ((-106.70000 15.60000, -106.00000 15.6...",0.000000
