# EPH - Individuos


## Ajuste de ruta del proyecto en Notebook

In [1]:
import sys

# Ajusto para que la reconozca la ruta del proyecto
sys.path.append("..") 

## Unificación de los archivos de Individuos

In [2]:
from src.utils.constants import DATA_SOURCE_DIR,DATA_PROCESSED_DIR,FILENAME_INDIVIDUOS_PROCESSED
from src.utils.helpers import  process_file, save_to_file

# Procesar y guardar individuos
encabezados,individual = process_file(DATA_SOURCE_DIR, category="individual")
save_to_file(DATA_PROCESSED_DIR,FILENAME_INDIVIDUOS_PROCESSED,encabezados,individual)

✅ Archivo guardado en: C:\Users\MONSO\code\data\processed\individuos_procesados.txt


## Procesamiento de los archivos

Abro el archivos procesados

In [3]:
from src.utils.constants import INDIVIDUOS_PROCESSED_DIR
from src.utils.helpers import read_file_dic

header,data=read_file_dic(INDIVIDUOS_PROCESSED_DIR)

Proceso el archivo

In [4]:
import src.procesamientos.individuos as indiv

fechamin,fechamax=indiv.add_extra_data(header,data)

if fechamin is not None and fechamax is not None:
    print(f"📅 Período procesado: desde {fechamin[1]}/{fechamin[0]} hasta {fechamax[1]}/{fechamax[0]}")
else:   
    print("No hay datos para procesar.")


📅 Período procesado: desde 4/2022 hasta 3/2024


Sobrescribo los datos procesados en el mismo archivo

In [5]:
save_to_file(DATA_PROCESSED_DIR,FILENAME_INDIVIDUOS_PROCESSED,header,data)

✅ Archivo guardado en: C:\Users\MONSO\code\data\processed\individuos_procesados.txt


## Análisis de Individuos

Abro el archivo de individuos procesado:

In [6]:
header,data=read_file_dic(INDIVIDUOS_PROCESSED_DIR)

Importo las funciones para realizar las consultas

In [7]:
import src.consultas.consultas as cs

### 1- A partir de la información de cada año contenida en el dataset se debe informar, año tras año, el porcentaje de personas mayores a 6 años capaces e incapaces de leer y escribir.

In [8]:
alfabetizadas=cs.cantidad_alfabetizadas(data)
cs.imprimir_alfabetizadas(alfabetizadas)

Año           % Alfabetos      % No Alfabetos
---------------------------------------------
2024                98.45                1.55
2023                97.84                2.16
2022                98.17                1.83


### 2- A partir de un año y trimestre elegido por el usuario informar el porcentaje de personas no nacidas en Argentina que hayan cursado un nivel universitario o superior

In [9]:
anio=input("Ingrese el año: ")
trim=input("Ingrese el trimestre [1 a 4]: ")

porcentaje=cs.porc_extranjero_universitario(anio,trim,data)
if porcentaje:
    print(f"El % de personas extranjeras que han cursado el nivel superior o universitario en el trimestre {trim} del año {anio} es del: {porcentaje:.2f}%")
else:
    print(f"No hay datos para el trimestre {trim} del año {anio}")

No hay datos para el trimestre 3 del año 2020


### 3- A partir de la información contenida en el dataset informar el año y trimestre donde hubo menor desocupación.

In [10]:
resultado=cs.info_menor_desocupacion(data)
if resultado:
    cs.imprimir_info_menor_desocupacion(resultado)

Año       Trimestre       Desocupados       
----------------------------------------
2023      4               822050            


### 4- Ranking de los 5 aglomerados con mayor porcentaje de hogares con dos o más ocupantes con estudios universitarios o superiores finalizados. Información obtenida a partir del par de archivos más recientes. 

In [11]:
ranking = cs.generar_ranking_hogares_universitarios(data)

cs.imprimir_tabla_ranking(ranking)


Puesto  Código  Aglomerado                              % Porcentaje
--------------------------------------------------------------------
1       32      Ciudad Autónoma de Buenos Aires               13.66%
2       2       Gran La Plata                                  7.75%
3       10      Gran Mendoza                                   6.61%
4       36      Río Cuarto                                     6.56%
5       26      Gran San Luis                                  6.08%


### 7- Informar para cada aglomerado el porcentaje de personas mayores que hayan cursado al menos en nivel universitario o superior.

Consideramos como muestra total para el cálculo porcentual sólo a las personas mayores de edad, que son las que tienen la posibilidad real de poder alcanzarlo.


In [13]:
info_filtrada = cs.info_porcentual_educacionsuperior_aglomerado(data)

cs.imprimir_info_porcentual_educacionsuperior_aglomerado(info_filtrada)

Aglomerado                               Porcentaje (%)
-------------------------------------------------------
32 - Ciudad Autónoma de Buenos Aires              62.19%
2 - Gran La Plata                                 44.09%
3 - Bahía Blanca - Cerri                          41.25%
13 - Gran Córdoba                                 40.93%
7 - Posadas                                       38.84%
4 - Gran Rosario                                  38.81%
19 - Jujuy - Palpalá                              38.72%
6 - Gran Paraná                                   38.68%
12 - Corrientes                                   38.15%
36 - Río Cuarto                                   37.93%
34 - Mar del Plata                                36.99%
23 - Gran Salta                                   36.87%
10 - Gran Mendoza                                 36.84%
17 - Neuquén - Plottier                           35.47%
25 - La Rioja                                     35.05%
29 - Gran Tucumán - Tafí Viejo   

### 9- Pedir al usuario que seleccione un aglomerado y a partir de la información contenida retornar una tabla que contenga la cantidad de personas mayores de edad según su nivel de estudios alcanzados.


In [None]:
if data:
    aglomerado = input("Ingrese el NÚMERO o NOMBRE COMPLETO de aglomerado: ")

    cs.tabla_nivel_educativo(data, aglomerado)
else:
    print("No hay data a procesar")

Aglomerado     5 - Gran Santa Fe
**************************************************************************************************************************************************************************************************************************************************************************************************************************************************************
Año     Trimestre   Primario incompleto / Ed. especial      Primario completo                       Secundario incompleto                   Secundario completo                     Superior universitario incompleto       Superior universitario completo         Sin instrucción                         
***************************************************************************************************************************************************************************************************************************************************************************************************************************

### 10- Pedir al usuario que seleccione dos aglomerados y a partir de la información contenida retornar una tabla que contenga el porcentaje de personas mayores de edad con secundario incompleto.

In [None]:
if data:
    try:
        aglo_input1 = int(input("Ingrese un aglomerado: "))
        aglo_input2 = int(input("Ingrese otro aglomerado: "))
    except ValueError:
        print("Por favor, ingrese un número válido.")
        exit() 

    tabla_porcentaje = cs.personas_secundario_incompleto_anio_trimestre(aglo_input1, aglo_input2, data)

    cs.imprimir_porcentaje_secundario_incompleto(tabla_porcentaje, aglo_input1, aglo_input2)
else:
    print("No hay datos a procesar")

  Año    Trimestre     Aglomerado 3         Aglomerado 3    
------------------------------------------------------------
  2024      3           13.63 %               0.00 %       
