Vamos a jugar un poco con python y Pandas.

Me bajé, del repositorio de datos de la ciudad de Buenos Aires, un listado completo de universidades con sede en CABA y sus unidades académicas: https://data.buenosaires.gob.ar/dataset/universidades

Vamos a ver qué podemos hacer con eso...

Primero vamos a importar pandas, para procesar el CSV como dataset

In [2]:
import pandas as pd

Vamos a levantar el CSV y a revisar qué tiene...

In [3]:
universidades_data = pd.read_csv('./universidades.csv')
universidades_data.head()

Unnamed: 0,regimen,universida,univ_c,unidad_aca,unac_c,anexo_c,unicue,cui,telef,fax,...,direccion_norm,calle,altura,WKT_gkba,barrio,comuna,codigo_postal,codigo_postal_argentino,long,lat
0,Privado,FLACSO (Facultad Latinoamericana de Ciencias S...,1,Rectorado,1,0,100100,2546,5238-9339 (C)5238-9300,4375-1373,...,Ayacucho 555,Ayacucho,555,POINT (-58.3953412190814 -34.6026584750106),Balvanera,Comuna 3,1026.0,C1026AAC,-58.395341,-34.602658
1,Privado,Instituto Tecnológico de Buenos Aires,2,Rectorado,1,0,200100,2456,63934813 [C]6393-4810,6393-4813,...,Av. Eduardo Madero 399,Av. Eduardo Madero,399,POINT (-58.3678488464698 -34.6031162314776),Puerto Madero,Comuna 1,1106.0,C1106ACD,-58.367849,-34.603116
2,Privado,Instituto Tecnológico de Buenos Aires,2,Departamento de Investigación,7,0,200700,2456,6393-4869,6393-4869,...,Av. Eduardo Madero 399,Av. Eduardo Madero,399,POINT (-58.3678488464698 -34.6031162314776),Puerto Madero,Comuna 1,1106.0,C1106ACD,-58.367849,-34.603116
3,Privado,Instituto Tecnológico de Buenos Aires,2,Área de Energía,40,0,204000,2456,6393-4870,6393-4870,...,Av. Eduardo Madero 399,Av. Eduardo Madero,399,POINT (-58.3678488464698 -34.6031162314776),Puerto Madero,Comuna 1,1106.0,C1106ACD,-58.367849,-34.603116
4,Privado,Instituto Tecnológico de Buenos Aires,2,Departamento de Bioingeniería,87,0,208700,2456,6393-4893,6393-4893,...,Av. Eduardo Madero 399,Av. Eduardo Madero,399,POINT (-58.3678488464698 -34.6031162314776),Puerto Madero,Comuna 1,1106.0,C1106ACD,-58.367849,-34.603116


Para romper los huevos, veamos de qué tipo es el listado (dataframe, obvio)

In [37]:
type(universidades_data)

pandas.core.frame.DataFrame

Dado que cada universidad tiene muchas sedes, vamos a ver dónde tienen sus rectorados

In [4]:
rectorados = universidades_data[universidades_data['unidad_aca'] == 'Rectorado']
print(rectorados)

     regimen                                         universida  univ_c  \
0    Privado  FLACSO (Facultad Latinoamericana de Ciencias S...       1   
1    Privado              Instituto Tecnológico de Buenos Aires       2   
28   Privado                      Instituto Universitario CEMIC       4   
31   Privado  Instituto Universitario de Ciencias de la Salu...       5   
33   Público    Instituto Universitario de Gendarmería Nacional       6   
35   Público  Instituto Universitario de la Policía Federal ...       7   
53   Privado  Instituto Universitario de Salud Mental de la ...       8   
59   Público      Instituto Universitario de Seguridad Marítima       9   
61   Público  Instituto Universitario del Ejército "Mayor Fr...      10   
64   Privado  Instituto Universitario Escuela Argentina de N...      11   
72   Privado  Instituto Universitario Escuela de Medicina de...      12   
81   Privado  Instituto Universitario Escuela Superior de Ec...      13   
88   Privado             

Ya que estamos jugando, vamos a ver cuáles son las universidades

In [5]:
universidades = universidades_data['universida'].unique()
len(universidades)


51

In [6]:
print(universidades)

['FLACSO (Facultad Latinoamericana de Ciencias Sociales)'
 'Instituto Tecnológico de Buenos Aires'
 'Instituto Universitario Aeronáutico' 'Instituto Universitario CEMIC'
 'Instituto Universitario de Ciencias de la Salud de la Fundación Barceló'
 'Instituto Universitario de Gendarmería Nacional'
 'Instituto Universitario de la Policía Federal Argentina'
 'Instituto Universitario de Salud Mental de la Asociación Psicoanalítica de Buenos Aires'
 'Instituto Universitario de Seguridad Marítima'
 'Instituto Universitario del Ejército "Mayor Francisco Romero"'
 'Instituto Universitario Escuela Argentina de Negocios'
 'Instituto Universitario Escuela de Medicina del Hospital Italiano'
 'Instituto Universitario Escuela Superior de Economía y Administración de Empresas'
 'Instituto Universitario ISEDET'
 'Instituto Universitario Nacional de Derechos Humanos "Madres de Plaza de Mayo"'
 'Instituto Universitario Naval' 'Instituto Universitario River Plate'
 'Pontificia Universidad Católica Argentin

Con la información de rectorados, y la de universidades, ahora quiero ver si todas las universidades tienen rectorado. Una forma trucha de hacerlo es verificar que ambos listados tienen la misma longitud:

In [8]:
if (len(universidades) == len(rectorados)):
  print('Sin iguales')
elif (len(universidades) > len(rectorados)):
  print('Hay universidades que no tienen rectorados')
else:
  print('Alguna universidad tiene más de un rectorado. Raro che.')

Hay universidades que no tienen rectorados


In [9]:
print(len(rectorados))
print(len(universidades))

38
51


Ahora voy a jugar con folium, una librería que encontré que puede servir para mostrar información geolocalizada (el CSV tiene información de latitud y longitud)

In [10]:
import folium

Le digo a folium que me cree un mapa, centrado en CABA, y con un toque de zoom para ver bien la ciudad

In [11]:
map_osm = folium.Map(location=[-34.5941696,-58.4583627], zoom_start=12)

map_osm

Ahora voy a iterar sobre el listado de universidades, para marcar en el mapa donde están las distintas sedes. Pongo circulitos para las sedes

In [12]:
universidades_data.apply(lambda row:folium.CircleMarker(location=[row["lat"], 
                                                  row["long"]]).add_to(map_osm),
         axis=1)
map_osm

Y ahora haré lo mismo con los rectorados, para contrastar donde tienen los rectorados las distintas universidades. Pongo marcadores típicos para los rectorados

In [13]:
rectorados.apply(lambda row:folium.Marker(location=[row["lat"], 
                                                  row["long"]]).add_to(map_osm),
         axis=1)
map_osm