#Taller Pandas: Operaciones con Pandas

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/e/ed/Pandas_logo.svg/1200px-Pandas_logo.svg.png" width="50%" style="text-align:center">

---

In [2]:
# Vamos a crear el DataFrame a partir de los datos de los municipios de Colombia
import pandas as pd
import math

muns = pd.read_csv("https://raw.githubusercontent.com/BrayanTorres2/Algoritmos-y-programacion/refs/heads/main/Data/municipios.csv", index_col=0)
muns.info()

<class 'pandas.core.frame.DataFrame'>
Index: 1122 entries, 404 to 103
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   nombre           1122 non-null   object
 1   poblaciónUrbana  1122 non-null   int64 
 2   poblaciónRural   1122 non-null   int64 
 3   departamento     1122 non-null   object
 4   esCapital        1122 non-null   int64 
dtypes: int64(3), object(2)
memory usage: 52.6+ KB


In [3]:
# Presentar la información de los primeros 5 municipios del dataframe
muns.head()

Unnamed: 0_level_0,nombre,poblaciónUrbana,poblaciónRural,departamento,esCapital
código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
404,Abejorral,6724,12471,Antioquia,0
178,Ábrego,17287,21076,Norte de Santander,0
1090,Abriaquí,738,1337,Antioquia,0
89,Acacías,60918,11130,Meta,0
705,Acandí,5259,4246,Chocó,0


In [4]:
# Presente la estadística descriptiva de la información del dataframe
muns.describe()

Unnamed: 0,poblaciónUrbana,poblaciónRural,esCapital
count,1122.0,1122.0,1122.0
mean,33637.03,10198.901961,0.02852
std,271573.3,11719.56716,0.166529
min,0.0,182.0,0.0
25%,1895.5,3697.25,0.0
50%,4995.0,6738.0,0.0
75%,13065.0,12722.0,0.0
max,8063991.0,173143.0,1.0


In [5]:
# Hallar la cantidad de municipios en el DataFrame
num_municipios = len(muns)

assert num_municipios == 1122

print("Cantidad de municipios =", num_municipios)

Cantidad de municipios = 1122


In [6]:
# Determinar el promedio de la población rural de todos los municipios del país
prom = muns["poblaciónRural"].mean()

assert math.isclose(10198.901961, prom, rel_tol=1e-6)
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [71]:
# Halle la cantidad total de municipio del departamento de Amazonas
n = (muns["departamento"]=="Amazonas").sum()

print(f"Hay {n} municipios en Amazonas")
assert n == 11
print("Prueba superada 💪🏽")

Hay 11 municipios en Amazonas
Prueba superada 💪🏽


In [74]:
# Escriba una función que reciba el nombre de un departamento y que retorne cuántos municipios hay
# en el departamento con ese nombre.
def municipios_departamento(muns: pd.DataFrame, nombre: str) -> int:
    n = (muns["departamento"]==nombre).sum()
    return n

# Pruebas de la función anterior
assert municipios_departamento(muns, "Cundinamarca") == 117
assert municipios_departamento(muns, "Boyacá") == 123
assert municipios_departamento(muns, "Vichada") == 4
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [75]:
# Escriba una expresión que permita encontrar los nombres de los municipios que tienen
# menos de 500 habitantes en la población rural
m = muns[muns["poblaciónRural"] < 500]["nombre"]


# Prueba
assert m.sort_values().to_list() == ['La Guadalupe', 'Santa Lucía', 'Soplaviento', 'Suan']
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [76]:
# Cual es la suma total de la población urbana de todos los municipios
pob_urb = muns["poblaciónUrbana"].sum()

# Prueba
assert pob_urb == 37_740_751
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [77]:
# Hallar la suma de la población urbana de los municipios de los departamentos
# del eje cafetero: Caldas, Quindio o Risaralda
pob_eje_cafetero = muns[muns["departamento"].isin(["Caldas", "Quindio", "Risaralda"])]["poblaciónUrbana"].sum()

# Prueba
assert pob_eje_cafetero == 1_471_055
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [78]:
# Encontrar el nombre del municipio que es la capital (esCapital == 1) del departamento de Casanare
capital_casanare = muns[(muns["departamento"] == "Casanare") & (muns["esCapital"] == 1)]["nombre"].iloc[0]

assert capital_casanare == "Yopal"


In [84]:
# Encontrar cuantos municipios tienen una población urbana inferior al promedio
# de la población urbama de todo el pais
prom_poblacion_urbana = muns["poblaciónUrbana"].mean()
cant_muns_pobl_inf_prom = (muns["poblaciónUrbana"] < prom_poblacion_urbana).sum()

# Prueba
assert cant_muns_pobl_inf_prom == 998
print("Prueba superada 💪🏽")

Prueba superada 💪🏽


In [86]:
# Presentar el nombre y problación urbana de los municipios cuya población urbana esté entre el millón y los tres millones
# de habitantes.
jugadores_entre_1_y_3_millones = muns[(muns["poblaciónUrbana"] >= 1_000_000) & (muns["poblaciónUrbana"] <= 3_000_000)][["nombre"]]


In [91]:
# Presentar toda la información de aquellos municipios donde la población rural supere a la población urbana
# Filtrar municipios donde la población rural es mayor que la población urbana

muns_rural_mayor_urbana = muns[muns["poblaciónRural"] > muns["poblaciónUrbana"]]

muns_rural_mayor_urbana.head()


Unnamed: 0_level_0,nombre,poblaciónUrbana,poblaciónRural,departamento,esCapital
código,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
404,Abejorral,6724,12471,Antioquia,0
178,Ábrego,17287,21076,Norte de Santander,0
1090,Abriaquí,738,1337,Antioquia,0
215,Acevedo,6515,27098,Huila,0
323,Achí,4193,19258,Bolívar,0


In [97]:
# Cuantas capitales hay en el dataframe

num_capitales = (muns["esCapital"] == "Sí").sum()
print("Cantidad de capitales:", num_capitales)


Cantidad de capitales: 0


In [100]:
# Determinar cuántos capitales tiene una población inferior a los 100 mil habitantes
# Calcular la población total

# aca determinamos cuantas capitales tienen una poblacion inferior a 100k
# filtramos para obtener solo las capitales

capitales = muns[muns["esCapital"] == 1].copy()

# Calculamos la población total para cada capital (suma de poblaciónRural y poblaciónUrbana)
capitales["poblacionTotal"] = capitales["poblaciónRural"] + capitales["poblaciónUrbana"]

# Contamos cuántas de estas capitales tienen una población total inferior a 100,000
num_capitales_pobl_baja = (capitales["poblacionTotal"] < 100000).sum()

print("Cantidad de capitales con población inferior a 100,000:", num_capitales_pobl_baja)

Cantidad de capitales con población inferior a 100,000: 8
