#Taller Pandas: Operaciones con Pandas

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/e/ed/Pandas_logo.svg/1200px-Pandas_logo.svg.png" width="50%" style="text-align:center">

---

In [None]:
# Vamos a crear el DataFrame a partir de los datos de los municipios de Colombia
import pandas as pd
import math

muns = pd.read_csv("https://raw.githubusercontent.com/BrayanTorres2/Algoritmos-y-programacion/refs/heads/main/Data/municipios.csv", index_col=0)
muns.info()

In [None]:
# Presentar la información de los primeros 5 municipios del dataframe
muns.head(5)

In [None]:
# Presente la estadística descriptiva de la información del dataframe
muns.describe()

In [None]:
# Hallar la cantidad de municipios en el DataFrame
num_municipios =  len(muns)

assert num_municipios == 1122

print("Cantidad de municipios =", num_municipios)

In [None]:
# Determinar el promedio de la población rural de todos los municipios del país
prom = muns.poblaciónRural.mean()

assert math.isclose(10198.901961, prom, rel_tol=1e-6)
print("Prueba superada 💪🏽")

In [None]:
# Halle la cantidad total de municipio del departamento de Amazonas
n = --- (muns["departamento"]== "Amazonas").sum()

print(f"Hay {n} municipios en Amazonas")
assert n == 11
print("Prueba superada 💪🏽")

In [None]:
# Escriba una función que reciba el nombre de un departamento y que retorne cuántos municipios hay
# en el departamento con ese nombre.
def municipios_departamento(muns: pd.DataFrame, nombre: str) -> int:
    n = (muns["departamento"]==nombre).sum()
    return n

# Pruebas de la función anterior
assert municipios_departamento(muns, "Cundinamarca") == 117
assert municipios_departamento(muns, "Boyacá") == 123
assert municipios_departamento(muns, "Vichada") == 4
print("Prueba superada 💪🏽")

In [None]:
# Escriba una expresión que permita encontrar los nombres de los municipios que tienen
# menos de 500 habitantes en la población rural
m = muns[muns["poblaciónRural"] < 500]["nombre"]

# Prueba
assert m.sort_values().to_list() == ['La Guadalupe', 'Santa Lucía', 'Soplaviento', 'Suan']
print("Prueba superada 💪🏽")

In [None]:
# Cual es la suma total de la población urbana de todos los municipios
pob_urb = muns["poblaciónUrbana"].sum()
# Prueba
assert pob_urb == 37_740_751
print("Prueba superada 💪🏽")

In [None]:
# Hallar la suma de la población urbana de los municipios de los departamentos
# del eje cafetero: Caldas, Quindio o Risaralda
pob_eje_cafetero = muns[muns["departamento"].isin(["Caldas", "Quindio", "Risaralda"])]["poblaciónUrbana"].sum()

# Prueba
assert pob_eje_cafetero == 1_471_055
print("Prueba superada 💪🏽")

In [None]:
# Encontrar el nombre del municipio que es la capital (esCapital == 1) del departamento de Casanare
capital_casanare = muns[(muns["departamento"] == "Casanare") & (muns["esCapital"] == 1)]["nombre"].iloc[0]


In [None]:
# Encontrar cuantos municipios tienen una población urbana inferior al promedio
# de la población urbama de todo el pais
prom_poblacion_urbana = muns["poblaciónUrbana"].mean()
cant_muns_pobl_inf_prom = (muns["poblaciónUrbana"] < prom_poblacion_urbana).sum()

# Prueba
assert cant_muns_pobl_inf_prom == 998
print("Prueba superada 💪🏽")

In [None]:
# Presentar el nombre y problación urbana de los municipios cuya población urbana esté entre el millón y los tres millones
# de habitantes.
habitantes_entre_1_y_3_millones = muns[(muns["poblaciónUrbana"] >= 1_000_000) & (muns["poblaciónUrbana"] <= 3_000_000)][["nombre"]]

In [None]:
# Presentar toda la información de aquellos municipios donde la población rural supere a la población urbana
muns_rural_mayor_urbana = muns[muns["poblaciónRural"] > muns["poblaciónUrbana"]]

muns_rural_mayor_urbana.head()

In [None]:
# Cuantas capitales hay en el dataframe
num_capitales = (muns["esCapital"] == "Sí").sum()
print("Cantidad de capitales:", num_capitales)

In [None]:
# Determinar cuántos capitales tiene una población inferior a los 100 mil habitantes
capitales = muns[muns["esCapital"] == 1].copy()
                                                        
capitales["poblacionTotal"] = capitales["poblaciónRural"] + capitales["poblaciónUrbana"]

num_capitales_pobl_baja = (capitales["poblacionTotal"] < 100000).sum()

print("Cantidad de capitales con población inferior a 100,000:", num_capitales_pobl_baja)