# Indicadores provinciales

Vamos a ver cómo cargar y visualizar datos de indicadores provinciales en Argentina utilizando pandas. El objetivo es poder explorar y analizar estos datos para sacar conclusiones relevantes.

---

Vamos a cargar un archivo CSV que contiene estos datos y explorarlos un poco.
El archivo CSV se encuentra en la carpeta `datasets` y se llama `indicadores-provinciales.csv`. Utilizaremos la librería pandas para leer el archivo y explorar su contenido.

In [24]:
from pathlib import Path

path = Path.cwd().parent
filename = Path("datasets", "indicadores-provinciales.csv")
filepath = Path(path, filename)
ENCODING = "latin-1"

Ahora vamos a importar pandas y cargar el archivo CSV utilizando la función `read_csv`. Para ello, necesitamos especificar la ruta del archivo, el delimitador (en este caso, una coma) y la codificación (latin-1).

Documentation:
https://pandas.pydata.org/docs

In [25]:
import pandas as pd

df = pd.read_csv(filepath, delimiter=",", encoding=ENCODING)

Ahora podemos explorar el DataFrame resultante para entender mejor los datos que contiene.

El método `head()` nos permite ver las primeras filas del DataFrame.

In [26]:
df.head()

Unnamed: 0,sector_id,sector_nombre,variable_id,actividad_producto_nombre,indicador,unidad_de_medida,fuente,frecuencia_nombre,cobertura_nombre,alcance_tipo,alcance_id,alcance_nombre,indice_tiempo,valor
0,99,Indicadores Provinciales,978,Mortalidad General,Tasa,por 1.000 habitantes,MSAL,Anual,Nacional,PAIS,200,Argentina,1980-01-01,8.6
1,99,Indicadores Provinciales,978,Mortalidad General,Tasa,por 1.000 habitantes,MSAL,Anual,Nacional,PAIS,200,Argentina,1981-01-01,8.4
2,99,Indicadores Provinciales,978,Mortalidad General,Tasa,por 1.000 habitantes,MSAL,Anual,Nacional,PAIS,200,Argentina,1982-01-01,8.0
3,99,Indicadores Provinciales,978,Mortalidad General,Tasa,por 1.000 habitantes,MSAL,Anual,Nacional,PAIS,200,Argentina,1983-01-01,8.5
4,99,Indicadores Provinciales,978,Mortalidad General,Tasa,por 1.000 habitantes,MSAL,Anual,Nacional,PAIS,200,Argentina,1984-01-01,8.5


La libreria pandas además ofrece muchas otras funcionalidades para manipular y analizar datos, como filtrar, agrupar, y realizar cálculos estadísticos.

En este caso, pandas, pudo deducir automáticamente las columnas y el tipo de datos de cada una, pero en otros casos puede ser necesario especificarlo manualmente.

Vamos a ver que columnas tiene el DataFrame y cuál es el tipo de datos de cada una.

In [27]:
for col in df.columns:
    print(f'Column: {col}, Type: {df[col].dtype}')

Column: sector_id, Type: int64
Column: sector_nombre, Type: object
Column: variable_id, Type: int64
Column: actividad_producto_nombre, Type: object
Column: indicador, Type: object
Column: unidad_de_medida, Type: object
Column: fuente, Type: object
Column: frecuencia_nombre, Type: object
Column: cobertura_nombre, Type: object
Column: alcance_tipo, Type: object
Column: alcance_id, Type: int64
Column: alcance_nombre, Type: object
Column: indice_tiempo, Type: object
Column: valor, Type: float64


El metodo `columns` nos da una lista de las columnas del DataFrame, y podemos usar el atributo `dtype` para obtener el tipo de datos de cada columna. Para ello accedemos a cada columna del DataFrame utilizando `df[col]`, donde `col` es el nombre de la columna.

Ahora vamos a explorar un poco más los datos. Queremos saber que 'indicares' existen en el DataFrame, para eso queremos saber que valores unicos tiene la columna 'actividad_producto_nombre'.

In [42]:
set_indicadores = set()
for valor in df.actividad_producto_nombre:
    set_indicadores.add(valor)

print(f'Hay {len(set_indicadores)} indicadores unicos:')
print(set_indicadores)

Hay 8 indicadores unicos:
{'Mortalidad Materna', 'Mortalidad General', 'PBG Total', 'Sector Público no financiero', 'Natalidad', 'Mortalidad Infantil', 'Sector Privado no financiero', 'Población'}


Usando un bucle for, podemos iterar sobre los valores unicos de la columna 'actividad_producto_nombre' y mostrarlos uno por uno.
Sin embargo, la libreria pandas ofrece una forma mucho más sencilla de obtener los valores unicos de una columna utilizando el metodo `unique()`.

In [45]:
indicadores = df.actividad_producto_nombre.unique()

for ind in indicadores:
    print(ind)

Mortalidad General
Mortalidad Infantil
Mortalidad Materna
Natalidad
PBG Total
Población
Sector Privado no financiero
Sector Público no financiero


De esta manera, podemos obtener los valores unicos de la columna 'actividad_producto_nombre' de manera sencilla y eficiente.
Es importante entonces conocer los metodos que pandas nos ofrece para manipular y analizar datos de manera eficiente.