#Taller Pandas: Operaciones con Pandas

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/e/ed/Pandas_logo.svg/1200px-Pandas_logo.svg.png" width="50%" style="text-align:center">

---

In [23]:
# Vamos a crear el DataFrame a partir de los datos de los municipios de Colombia
import pandas as pd
import math

muns = pd.read_csv("https://raw.githubusercontent.com/BrayanTorres2/Algoritmos-y-programacion/refs/heads/main/Data/municipios.csv", index_col=0)
muns.info()

<class 'pandas.core.frame.DataFrame'>
Index: 1122 entries, 404 to 103
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   nombre           1122 non-null   object
 1   poblaciónUrbana  1122 non-null   int64 
 2   poblaciónRural   1122 non-null   int64 
 3   departamento     1122 non-null   object
 4   esCapital        1122 non-null   int64 
dtypes: int64(3), object(2)
memory usage: 52.6+ KB


In [9]:
# Presentar la información de los primeros 5 municipios del dataframe
print(muns.head())


           nombre  poblaciónUrbana  poblaciónRural        departamento  \
código                                                                   
404     Abejorral             6724           12471           Antioquia   
178        Ábrego            17287           21076  Norte de Santander   
1090     Abriaquí              738            1337           Antioquia   
89        Acacías            60918           11130                Meta   
705        Acandí             5259            4246               Chocó   

        esCapital  
código             
404             0  
178             0  
1090            0  
89              0  
705             0  


In [11]:
# Presente la estadística descriptiva de la información del dataframe
print(muns.describe())

       poblaciónUrbana  poblaciónRural    esCapital
count     1.122000e+03     1122.000000  1122.000000
mean      3.363703e+04    10198.901961     0.028520
std       2.715733e+05    11719.567160     0.166529
min       0.000000e+00      182.000000     0.000000
25%       1.895500e+03     3697.250000     0.000000
50%       4.995000e+03     6738.000000     0.000000
75%       1.306500e+04    12722.000000     0.000000
max       8.063991e+06   173143.000000     1.000000


In [4]:
# Hallar la cantidad de municipios en el DataFrame
num_municipios = len(muns)


assert num_municipios == 1122

print("Cantidad de municipios =", num_municipios)

Cantidad de municipios = 1122


In [5]:
# Determinar el promedio de la población rural de todos los municipios del país

prom = muns["poblaciónRural"].mean()

assert math.isclose(10198.901961, prom, rel_tol=1e-6)
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [6]:
# Halle la cantidad total de municipio del departamento de Amazonas
n = muns[muns["departamento"] == "Amazonas"].shape[0]


print(f"Hay {n} municipios en Amazonas")
assert n == 11
print("Prueba superada 💪🏽")

Hay 11 municipios en Amazonas
Prueba superada 💪🏽


In [12]:
# Escriba una función que reciba el nombre de un departamento y que retorne cuántos municipios hay
# en el departamento con ese nombre.

def municipios_departamento(muns: pd.DataFrame, nombre: str) -> int:
    n = muns[muns["departamento"] == nombre].shape[0]
    return n

# Pruebas de la función anterior
assert municipios_departamento(muns, "Cundinamarca") == 117
assert municipios_departamento(muns, "Boyacá") == 123
assert municipios_departamento(muns, "Vichada") == 4
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [13]:
# Escriba una expresión que permita encontrar los nombres de los municipios que tienen
# menos de 500 habitantes en la población rural
m = muns[muns["poblaciónRural"] < 500]["nombre"]

# Prueba
assert m.sort_values().to_list() == ['La Guadalupe', 'Santa Lucía', 'Soplaviento', 'Suan']
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [14]:
# Cual es la suma total de la poblacion rural de todos los municipios
pob_urb = muns["poblaciónUrbana"].sum()
 
# Prueba
assert pob_urb == 37_740_751
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [15]:
# Hallar la suma de la población urbana de los municipios de los departamentos
# del eje cafetero: Caldas, Quindio o Risaralda
pob_eje_cafetero = muns[muns["departamento"].isin(["Caldas", "Quindio", "Risaralda"])]["poblaciónUrbana"].sum()

# Prueba
assert pob_eje_cafetero == 1_471_055
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [16]:
# Encontrar el nombre del municipio que es la capital (esCapital == 1) del departamento de Casanare
capital_casanare = muns[(muns["esCapital"] == 1) & (muns["departamento"] == "Casanare")]["nombre"].values[0]

print(f"La capital de Casanare es {capital_casanare}")


La capital de Casanare es Yopal


In [17]:
# Encontrar cuantos municipios tienen una población urbana inferior al promedio
# de la población urbama de todo el pais
prom_poblacion_urbana = muns["poblaciónUrbana"].mean()
cant_muns_pobl_inf_prom = len(muns[muns["poblaciónUrbana"] < prom_poblacion_urbana])

# Prueba
assert cant_muns_pobl_inf_prom == 998
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [18]:
# Presentar el nombre y problación urbana de los municipios cuya población urbana esté entre el millón y los tres millones
# de habitantes.
muns_filtrados = muns[(muns["poblaciónUrbana"] >= 1_000_000) & (muns["poblaciónUrbana"] <= 3_000_000)][["nombre", "poblaciónUrbana"]]
print(muns_filtrados)

              nombre  poblaciónUrbana
código                               
4       Barranquilla          1224374
3               Cali          2383392
2           Medellín          2479990


In [19]:
# Presentar toda la información de aquellos municipios donde la población rural supere a la población urbana
muns_rural_urbana = muns[muns["poblaciónRural"] > muns["poblaciónUrbana"]]
print(muns_rural_urbana)


               nombre  poblaciónUrbana  poblaciónRural        departamento  \
código                                                                       
404         Abejorral             6724           12471           Antioquia   
178            Ábrego            17287           21076  Norte de Santander   
1090         Abriaquí              738            1337           Antioquia   
215           Acevedo             6515           27098               Huila   
323              Achí             4193           19258             Bolívar   
...               ...              ...             ...                 ...   
744           Zapayán             3649            5192           Magdalena   
240          Zaragoza            14137           16992           Antioquia   
971         Zetaquira             1057            3432              Boyacá   
895           Zipacón             2119            3512        Cundinamarca   
103     Zona Bananera             5063           56309          

In [20]:
# Cuantas capitales hay en el dataframe
num_capitales = len(muns[muns["esCapital"] == 1])

print(f"Hay {num_capitales} capitales en el dataframe")

Hay 32 capitales en el dataframe


In [21]:
# Determinar cuántos capitales tiene una población inferior a los 100 mil habitantes
num_capitales_pob_inf_100k = len(muns[(muns["esCapital"] == 1) & (muns["poblaciónUrbana"] < 100000)])

print(f"Hay {num_capitales_pob_inf_100k} capitales con población inferior a 100 mil habitantes")

Hay 8 capitales con población inferior a 100 mil habitantes
