In [1]:
import geopandas as gpd
import pandas as pd

In [5]:
gdf = gpd.read_file('Predios Educativos 02-12-2025.geojson')

In [7]:
gdf.head()

Unnamed: 0,id,cui,id_distrito,distrito,region_educativa,cue_clave,superficie,latitud,longitud,geometry
0,predios.fid--78246af0_19ae1a100fb_-21ff,600100011,1,La Plata,Región I,061060000-0001AD0003,364.48 m²,-34.917487,-57.947516,"MULTIPOLYGON (((-57.94745 -34.9176, -57.9477 -..."
1,predios.fid--78246af0_19ae1a100fb_-21fe,600100024,1,La Plata,Región I,061498400-0001AE0001,295.44 m²,-34.913998,-57.957118,"MULTIPOLYGON (((-57.95695 -34.91406, -57.95702..."
2,predios.fid--78246af0_19ae1a100fb_-21fd,600100030,1,La Plata,Región I,"061498500-0001AE0002,060899400-0001IS0012",1292.32 m²,-34.934104,-57.924442,"MULTIPOLYGON (((-57.92473 -34.93419, -57.92436..."
3,predios.fid--78246af0_19ae1a100fb_-21fc,600100048,1,La Plata,Región I,062319600-0001AF0001,1084.40 m²,-34.882811,-58.01916,"MULTIPOLYGON (((-58.01914 -34.88261, -58.01891..."
4,predios.fid--78246af0_19ae1a100fb_-21fb,600100053,1,La Plata,Región I,060794600-0001AM0001,7703.34 m²,-34.898281,-57.984781,"MULTIPOLYGON (((-57.98507 -34.89788, -57.98413..."


# Cargar datos de Ofertas APD

In [None]:
# Importar librería para JSON
import json

# Cargar el archivo JSON
with open('ofertas_muestra.json', 'r', encoding='utf-8') as f:
    data = json.load(f)

# Convertir las ofertas a DataFrame
df_ofertas = pd.DataFrame(data['ofertas'])

print(f"Total de ofertas cargadas: {len(df_ofertas):,}")
print(f"Columnas disponibles: {len(df_ofertas.columns)}")
print(f"Dimensiones: {df_ofertas.shape}")

In [None]:
# Ver las primeras filas
df_ofertas.head()

In [None]:
# Ver solo las columnas principales
columnas_principales = ['estado', 'cargo', 'descdistrito', 'escuela', 'descnivelmodalidad', 'turno', 'hsmodulos']
df_ofertas[columnas_principales].head(10)

In [None]:
# Información general del DataFrame
df_ofertas.info()

## Ejemplos de análisis básicos

In [None]:
# Distribución por estado
df_ofertas['estado'].value_counts()

In [None]:
# Top 10 distritos con más ofertas
df_ofertas['descdistrito'].value_counts().head(10)

In [None]:
# Top 10 cargos más ofertados
df_ofertas['cargo'].value_counts().head(10)

## Ejemplos de filtrado

In [None]:
# Filtrar solo ofertas publicadas
df_publicadas = df_ofertas[df_ofertas['estado'] == 'Publicada']
print(f"Ofertas publicadas: {len(df_publicadas):,}")
df_publicadas.head()

In [None]:
# Filtrar por distrito (ejemplo: TIGRE)
df_tigre = df_ofertas[df_ofertas['descdistrito'] == 'TIGRE']
print(f"Ofertas en TIGRE: {len(df_tigre)}")
df_tigre[columnas_principales].head()

In [None]:
# Buscar ofertas que contengan "INGLES" en el cargo
df_ingles = df_ofertas[df_ofertas['cargo'].str.contains('INGLES', case=False, na=False)]
print(f"Ofertas de Inglés: {len(df_ingles)}")
df_ingles[['cargo', 'descdistrito', 'estado']].head()

In [None]:
# Múltiples filtros: Publicadas + Nivel Primario + Distrito específico
df_filtrado = df_ofertas[
    (df_ofertas['estado'] == 'Publicada') &
    (df_ofertas['descnivelmodalidad'] == 'PRIMARIA') &
    (df_ofertas['descdistrito'] == 'LA MATANZA')
]
print(f"Resultados: {len(df_filtrado)}")
df_filtrado[columnas_principales].head()