In [1]:
# LIBRERIRAS
import sys 
import csv
sys.path.append("..")
from src.utils.constantes import DATA_CLEAN_PATH



In [2]:
# IMPORTACION DE DATA
path_individual_clean = DATA_CLEAN_PATH / "usu_clean_individual.csv"
path_hogar_clean = DATA_CLEAN_PATH / "usu_clean_hogar.csv"

def leer_csv(ruta_archivo):
    """
    Lee un archivo CSV, corrige el formato de separación si es necesario,
    y retorna una tupla con el encabezado y la lista de filas (ya separadas en columnas).

    Parámetros:
    - ruta_archivo: objeto Path al archivo CSV

    Retorna:
    - header: lista con los nombres de las columnas
    - lista_filas: lista de listas con los datos por fila
    """
    with ruta_archivo.open("r", encoding="utf-8") as f:
        reader = csv.reader(f, delimiter=",")
        header = next(reader)
        lista_filas = []

        for elem in reader:
            new_elem = elem
            lista_filas.append(new_elem)

    return header, lista_filas

# Cargar los archivos CSV
header_individual, lista_filas_individual = leer_csv(path_individual_clean)
header_hogar, lista_filas_hogar = leer_csv(path_hogar_clean)

In [3]:
# FUNCIONES AXULIARES
def mostrar_filas(header, lista_filas, cantidad=5):
    """
    Imprime el encabezado y las primeras 'cantidad' filas.

    Parámetros:
    - header: lista con los nombres de las columnas
    - lista_filas: lista de listas con los datos
    - cantidad: número de filas a mostrar (por defecto, 5)
    """
    print("Encabezado:")
    print(header)
    print("\nPrimeras filas:")
    for i, fila in enumerate(lista_filas[:cantidad], start=1):
        print(f"Fila {i}: {fila}")

def mostrar_valores_columna(header, lista_filas, indice_columna, cantidad=10):
    """
    Muestra los valores de la columna indicada sin contar las repeticiones.

    Parámetros:
    - header: lista con los nombres de las columnas
    - lista_filas: lista de listas con los datos
    - indice_columna: índice de la columna a analizar
    - cantidad: número de valores a mostrar (por defecto, 10)
    """
    nombre_columna = header[indice_columna]
    print(f"Columna {nombre_columna}")

    valores = [fila[indice_columna] for fila in lista_filas]

    for i, valor in enumerate(valores[:cantidad], start=1):
        print(f"Fila {i}: {valor}")

def enumerar_titulos(header):
    """
    Imprime los nombres de las columnas enumeradas.

    Parámetros:
    - header: lista con los nombres de las columnas
    """
    print("Títulos enumerados:")
    for i, nombre_columna in enumerate(header):
        print(f"{i}: {nombre_columna}")

In [4]:
enumerar_titulos(header_hogar)


Títulos enumerados:
0: CODUSU
1: ANO4
2: TRIMESTRE
3: NRO_HOGAR
4: REALIZADA
5: REGION
6: MAS_500
7: AGLOMERADO
8: PONDERA
9: IV1
10: IV1_ESP
11: IV2
12: IV3
13: IV3_ESP
14: IV4
15: IV5
16: IV6
17: IV7
18: IV7_ESP
19: IV8
20: IV9
21: IV10
22: IV11
23: IV12_1
24: IV12_2
25: IV12_3
26: II1
27: II2
28: II3
29: II3_1
30: II4_1
31: II4_2
32: II4_3
33: II5
34: II5_1
35: II6
36: II6_1
37: II7
38: II7_ESP
39: II8
40: II8_ESP
41: II9
42: V1
43: V2
44: V21
45: V22
46: V3
47: V4
48: V5
49: V6
50: V7
51: V8
52: V9
53: V10
54: V11
55: V12
56: V13
57: V14
58: V15
59: V16
60: V17
61: V18
62: V19_A
63: V19_B
64: IX_TOT
65: IX_MEN10
66: IX_MAYEQ10
67: ITF
68: DECIFR
69: IDECIFR
70: RDECIFR
71: GDECIFR
72: PDECIFR
73: ADECIFR
74: IPCF
75: DECCFR
76: IDECCFR
77: RDECCFR
78: GDECCFR
79: PDECCFR
80: ADECCFR
81: PONDIH
82: VII1_1
83: VII1_2
84: VII2_1
85: VII2_2
86: VII2_3
87: VII2_4
88: TIPO_HOGAR
89: MATERIAL_TECHUMBRE
90: DENSIDAD_HOGAR
91: CONDICION_DE_HABITABILIDAD


In [5]:
enumerar_titulos(header_individual)

Títulos enumerados:
0: CODUSU
1: ANO4
2: TRIMESTRE
3: NRO_HOGAR
4: COMPONENTE
5: H15
6: REGION
7: MAS_500
8: AGLOMERADO
9: PONDERA
10: CH03
11: CH04
12: CH05
13: CH06
14: CH07
15: CH08
16: CH09
17: CH10
18: CH11
19: CH12
20: CH13
21: CH14
22: CH15
23: CH15_COD
24: CH16
25: CH16_COD
26: NIVEL_ED
27: ESTADO
28: CAT_OCUP
29: CAT_INAC
30: IMPUTA
31: PP02C1
32: PP02C2
33: PP02C3
34: PP02C4
35: PP02C5
36: PP02C6
37: PP02C7
38: PP02C8
39: PP02E
40: PP02H
41: PP02I
42: PP03C
43: PP03D
44: PP3E_TOT
45: PP3F_TOT
46: PP03G
47: PP03H
48: PP03I
49: PP03J
50: INTENSI
51: PP04A
52: PP04B_COD
53: PP04B1
54: PP04B2
55: PP04B3_MES
56: PP04B3_ANO
57: PP04B3_DIA
58: PP04C
59: PP04C99
60: PP04D_COD
61: PP04G
62: PP05B2_MES
63: PP05B2_ANO
64: PP05B2_DIA
65: PP05C_1
66: PP05C_2
67: PP05C_3
68: PP05E
69: PP05F
70: PP05H
71: PP06A
72: PP06C
73: PP06D
74: PP06E
75: PP06H
76: PP07A
77: PP07C
78: PP07D
79: PP07E
80: PP07F1
81: PP07F2
82: PP07F3
83: PP07F4
84: PP07F5
85: PP07G1
86: PP07G2
87: PP07G3
88: PP07G4
89:

In [6]:
mostrar_filas(header_individual, lista_filas_individual)

Encabezado:
['CODUSU', 'ANO4', 'TRIMESTRE', 'NRO_HOGAR', 'COMPONENTE', 'H15', 'REGION', 'MAS_500', 'AGLOMERADO', 'PONDERA', 'CH03', 'CH04', 'CH05', 'CH06', 'CH07', 'CH08', 'CH09', 'CH10', 'CH11', 'CH12', 'CH13', 'CH14', 'CH15', 'CH15_COD', 'CH16', 'CH16_COD', 'NIVEL_ED', 'ESTADO', 'CAT_OCUP', 'CAT_INAC', 'IMPUTA', 'PP02C1', 'PP02C2', 'PP02C3', 'PP02C4', 'PP02C5', 'PP02C6', 'PP02C7', 'PP02C8', 'PP02E', 'PP02H', 'PP02I', 'PP03C', 'PP03D', 'PP3E_TOT', 'PP3F_TOT', 'PP03G', 'PP03H', 'PP03I', 'PP03J', 'INTENSI', 'PP04A', 'PP04B_COD', 'PP04B1', 'PP04B2', 'PP04B3_MES', 'PP04B3_ANO', 'PP04B3_DIA', 'PP04C', 'PP04C99', 'PP04D_COD', 'PP04G', 'PP05B2_MES', 'PP05B2_ANO', 'PP05B2_DIA', 'PP05C_1', 'PP05C_2', 'PP05C_3', 'PP05E', 'PP05F', 'PP05H', 'PP06A', 'PP06C', 'PP06D', 'PP06E', 'PP06H', 'PP07A', 'PP07C', 'PP07D', 'PP07E', 'PP07F1', 'PP07F2', 'PP07F3', 'PP07F4', 'PP07F5', 'PP07G1', 'PP07G2', 'PP07G3', 'PP07G4', 'PP07G_59', 'PP07H', 'PP07I', 'PP07J', 'PP07K', 'PP08D1', 'PP08D4', 'PP08F1', 'PP08F2', '

In [7]:
mostrar_valores_columna(header_hogar, lista_filas_hogar, 37)

Columna II7
Fila 1: 1
Fila 2: 1
Fila 3: 3
Fila 4: 1
Fila 5: 1
Fila 6: 2
Fila 7: 3
Fila 8: 1
Fila 9: 2
Fila 10: 1


In [8]:
# FUNCIONES MAS USADAS - Recicladas
def agrupar_por_anio(filas, col_anio=1):
    """
    Agrupa las filas por año
    Retorna un diccionario: {anio: [filas_del_anio]}
    """
    dic_anios = {}
    for fila in filas:
        anio = fila[col_anio]
        if anio not in dic_anios:
            dic_anios[anio] = []
        dic_anios[anio].append(fila)
    return dic_anios

def separar_por_trimestres(filas, col_trimestre=2):
    """
    Agrupa una lista de filas según el trimestre (por defecto, columna 2).

    Retorna un diccionario: {trimestre: [filas_del_trimestre]}
    """
    dic_trimestres = {}
    for fila in filas:
        trimestre = fila[col_trimestre]
        if trimestre not in dic_trimestres:
            dic_trimestres[trimestre] = []
        dic_trimestres[trimestre].append(fila)
    return dic_trimestres

def agrupar_por_anio_y_trimestre(filas):
    """
    Agrupa una lista de filas por año y, dentro de cada año, por trimestre.

    Retorna un diccionario: {anio: {trimestre: [filas]}}
    """
    dic_anios = agrupar_por_anio(filas)
    dic_anio_trimestre = {}
    for anio, filas_anio in dic_anios.items():
        dic_anio_trimestre[anio] = separar_por_trimestres(filas_anio)
    return dic_anio_trimestre

def porcentaje(valor,total):
    return (valor / total) * 100

# def obtener_ultimo_anio(filas, col_anio=1):
#     """
#     Devuelve el último año presente en las filas.
#     """
#     dic_anios = agrupar_por_anio(filas, col_anio)
#     return max(dic_anios.keys())

def obtener_ultimo_trimestre(dict_anio_trimestre, anio):
    """
    Devuelve el último trimestre disponible para un año dado.
    """
    return max(dict_anio_trimestre[anio].keys())

# def obtener_ultimo_anio_y_trimestre(filas):
#     """
#     Devuelve el último (año, trimestre) disponible, usando agrupación por año y trimestre.
#     """
#     dic_anio_trimestre = agrupar_por_anio_y_trimestre(filas)
#     ultimo_anio = max(dic_anio_trimestre.keys())
#     ultimo_trimestre = obtener_ultimo_trimestre(dic_anio_trimestre, ultimo_anio)
#     return ultimo_anio, ultimo_trimestre

def obtener_ultimo_periodo(filas):
    """
    Devuelve el (año, trimestre) más reciente presente en el dataset.
    fila[1] = año, fila[2] = trimestre
    """
    return max((int(fila[1]), int(fila[2])) for fila in filas)

def listar_periodos_disponibles(filas, col_anio=1, col_trimestre=2):
    """
    Retorna una lista de tuplas (año, trimestre) disponibles en los datos, sin repetir y ordenados.
    """
    periodos = set()

    for fila in filas:
        try:
            anio = int(fila[col_anio])
            trimestre = int(fila[col_trimestre])
            periodos.add((anio, trimestre))
        except (ValueError, IndexError):
            continue  # Ignora filas con datos mal formateados

    return sorted(periodos)

def nombre_aglomerado(codigo):
    """
    Devuelve el nombre del aglomerado a partir de su código.
    """
    dic_aglomerados = {
        '2': 'Gran La Plata',
        '3': 'Bahía Blanca - Cerri',
        '4': 'Gran Rosario',
        '5': 'Gran Santa Fé',
        '6': 'Gran Paraná',
        '7': 'Posadas',
        '8': 'Gran Resistencia',
        '9': 'Comodoro Rivadavia - Rada Tilly',
        '10': 'Gran Mendoza',
        '12': 'Corrientes',
        '13': 'Gran Córdoba',
        '14': 'Concordia',
        '15': 'Formosa',
        '17': 'Neuquén - Plottier',
        '18': 'Santiago del Estero - La Banda',
        '19': 'Jujuy - Palpalá',
        '20': 'Río Gallegos',
        '22': 'Gran Catamarca',
        '23': 'Gran Salta',
        '25': 'La Rioja',
        '26': 'Gran San Luis',
        '27': 'Gran San Juan',
        '29': 'Gran Tucumán - Tafí Viejo',
        '30': 'Santa Rosa - Toay',
        '31': 'Ushuaia - Río Grande',
        '32': 'Ciudad Autónoma de Buenos Aires',
        '33': 'Partidos del GBA',
        '34': 'Mar del Plata',
        '36': 'Río Cuarto',
        '38': 'San Nicolás - Villa Constitución',
        '91': 'Rawson - Trelew',
        '93': 'Viedma - Carmen de Patagones'
    }
    return dic_aglomerados.get(codigo)

def filtrar_por_anio_y_trimestre(filas, año, trimestre, col_anio=1, col_trimestre=2):
    """
    Devuelve una lista de filas que coinciden con el año y trimestre indicados.
    """
    return [
        fila for fila in filas
        if int(fila[col_anio]) == año and int(fila[col_trimestre]) == trimestre
    ]

def agrupar_por_aglomerado(filas, col_aglomerado):
    """
    Agrupa las filas según el valor presente en la columna de aglomerado.

    Parámetros:
    - filas: lista de listas, donde cada sublista representa una fila de datos.
    - col_aglomerado: índice entero que indica la posición de la columna que contiene el código del aglomerado.
    En hogares el aglomerado corresponde a la columna 8 y en hogares a la 7

    Retorna:
    - Un diccionario cuyas claves son los códigos de aglomerados y los valores son listas de filas que pertenecen a cada aglomerado.
    """
    grupos = {}
    for fila in filas:
        aglo = fila[col_aglomerado]
        if aglo not in grupos:
            grupos[aglo] = []
        grupos[aglo].append(fila)
    return grupos

def suma_ponderada(filas, condicion, col_pondera):
    """
    Calcula la suma ponderada de una determinada columna, considerando solo las filas que cumplen una condición.

    Parámetros:
    - filas: lista de listas, donde cada sublista representa una fila de datos.
    - condicion: función que recibe una fila y devuelve True si debe ser considerada en la suma.
    - col_pondera: índice entero que indica la posición de la columna que contiene el valor ponderador.

    Retorna:
    - Un número entero que representa la suma ponderada de las filas que cumplen con la condición.
    """
    total = 0
    for fila in filas:
        if condicion(fila):
            total += int(fila[col_pondera])
    return total

def filtrar_por_condicion(filas, condicion):
    """
    Filtra las filas de la base de datos según la condición proporcionada.

    Parámetros:
    - filas: Lista de filas de datos (cada fila es un registro de la base de datos).
    - condicion: Función que toma una fila y devuelve True si la fila cumple la condición, False si no.

    Retorna:
    - Una lista con las filas que cumplen con la condición.
    """
    # Filtrar las filas usando la condición proporcionada
    filas_filtradas = [fila for fila in filas if condicion(fila)]
    return filas_filtradas


## 1

1- A partir de la información de cada año contenida en el dataset se debe informar, año tras año, el porcentaje de personas mayores a 6 años capaces e incapaces de leer y escribir.
Importante: tomar la información del último trimestre de cada año.

### Tabla individual  
COlumnas usadas:
1- ANO4 - Año de relevamiento
2- TRIMESTRE
9- PONDERA
13- CH06 - ¿Cuántos años cumplidos tiene?
16- CH09 ¿Sabe leer y escribir?

In [9]:
def contar_alfabetismo(filas):
    """
    Recorre las filas y calcula los totales ponderados de:
    alfabetos, analfabetos, casos desconocidos y población mayor a 6 años.
    """
    
    alfabetos = analfabetos = desconocido = poblacion = 0

    for elem in filas:
        pondera = int(elem[9])
        edad = int(elem[13])
        if edad >= 6:
            poblacion += pondera
            if elem[16] == "1":
                alfabetos += pondera
            elif elem[16] == "2":
                analfabetos += pondera
            else:
                desconocido += pondera
    return alfabetos, analfabetos, desconocido, poblacion

def calcular_porcentajes(alfabetos, analfabetos, desconocido, poblacion):
    """
    Calcula los porcentajes de alfabetos, analfabetos y desconocidos sobre la población total.
    """
    return (
        porcentaje(alfabetos, poblacion),
        porcentaje(analfabetos, poblacion),
        porcentaje(desconocido, poblacion),
    )

def analizar_analfabetismo(dict_anio_trimestre):
    """
    Para cada año, calcula e imprime el último trimestre disponible y los
    porcentajes de alfabetos, analfabetos y casos desconocidos en población > 6 años.
    """
    for anio in dict_anio_trimestre:
        trimestre = obtener_ultimo_trimestre(dict_anio_trimestre, anio)
        filas = dict_anio_trimestre[anio][trimestre]
        alfabetos, analfabetos, desconocido, poblacion = contar_alfabetismo(filas)
        por_alfa, por_ana, por_desc = calcular_porcentajes(alfabetos, analfabetos, desconocido, poblacion)

        print(f"Año {anio}, Trimestre {trimestre}")
        print(f"  - Alfabetismo: {por_alfa:.2f}%")
        print(f"  - Analfabetismo: {por_ana:.2f}%")
        print(f"  - Desconocido: {por_desc:.2f}%\n")

def actividad_1(lista_filas_individual):
    dict_anio_trimestre_individual = agrupar_por_anio_y_trimestre(lista_filas_individual)
    analizar_analfabetismo(dict_anio_trimestre_individual)

In [10]:
actividad_1(lista_filas_individual)

Año 2024, Trimestre 2
  - Alfabetismo: 98.57%
  - Analfabetismo: 1.39%
  - Desconocido: 0.04%

Año 2023, Trimestre 4
  - Alfabetismo: 98.47%
  - Analfabetismo: 1.46%
  - Desconocido: 0.07%



## 2

2. A partir de un año y trimestre elegido por el usuario informar el porcentaje de personas no nacidas en Argentina que hayan cursado un nivel universitario o superior.

#### Tabla individual  
1- ANO4 N (4) Año de relevamiento (4 dígitos)

2- TRIMESTRE N (1) Ventana de observación  
- = 1° trimestre  
- = 2° trimestre  
- = 3° trimestre  
- = 4° trimestre  

9- PONDERA N (6) Ponderación  

19- CH12 N (2) ¿Cuál es el nivel más alto que cursa o cursó?
- 1 = Jardín/preescolar
- 2 = Primario
- 3 = EGB
- 4 = Secundario
- 5 = Polimodal
- 6 = Terciario
- 7 = Universitario
- 8 = Posgrado universitario
- 9 = Educación especial (discapacitado)

22- CH15 N (1) ¿Dónde nació?
1. En esta localidad
2. En otra localidad de esta provincia
3. En otra provincia (especificar)
4. En un país limítrofe (especificar: Brasil, Bolivia, Chile, Paraguay, Uruguay)
5. En otro país (especificar)
9. Ns/Nr

26- NIVEL_ED N (1) Nivel educativo
- 1 = Primario incompleto (incluye educación especial)
- 2 = Primario completo
- 3 = Secundario incompleto
- 4 = Secundario completo
- 5 = Superior universitario incompleto
- 6 = Superior universitario completo
- 7 = Sin instrucción
- 9 = Ns/Nr

______________________________
Columnas usadas: 1 - 2 - 9 - 19 - 22

In [11]:
def es_extranjero(valor_ch15):
    """Devuelve True si la persona nació fuera de Argentina."""
    return valor_ch15 in ['4', '5']

def es_universitario(valor_ch12):
    """Devuelve True si la persona alcanzó nivel universitario o posgrado."""
    return valor_ch12 in ['7', '8']

def contar_extranjeros_universitarios(filas):
    """
    Recorre las filas y calcula los totales ponderados de:
    - Extranjeros
    - Universitarios
    - Universitarios extranjeros
    """
    total_extranjeros = total_universitarios = total_universitarios_extranjeros = 0

    for elem in filas:
        pondera = int(elem[9])
        ch12 = elem[19]  # nivel educativo
        ch15 = elem[22]  # lugar de nacimiento

        if es_extranjero(ch15):
            total_extranjeros += pondera
            if es_universitario(ch12):
                total_universitarios_extranjeros += pondera

        if es_universitario(ch12):
            total_universitarios += pondera

    return total_extranjeros, total_universitarios, total_universitarios_extranjeros

def porcentajes_universitarios_extranjeros(total_extranjeros, total_universitarios, total_universitarios_extranjeros):
    """
    Calcula tres porcentajes:
    - % de universitarios extranjeros sobre el total de extranjeros
    - % de universitarios extranjeros sobre el total de universitarios
    - % de universitarios extranjeros sobre el total de la muestra combinada
    """
    total_muestra = total_extranjeros + total_universitarios  # para referencia general

    por_sobre_extranjeros = porcentaje(total_universitarios_extranjeros, total_extranjeros) if total_extranjeros else 0
    por_sobre_universitarios = porcentaje(total_universitarios_extranjeros, total_universitarios) if total_universitarios else 0
    por_sobre_muestra = porcentaje(total_universitarios_extranjeros, total_muestra) if total_muestra else 0

    return round(por_sobre_extranjeros, 2), round(por_sobre_universitarios, 2), round(por_sobre_muestra, 2)

def analizar_universitarios_extranjeros(dict_anio_trimestre):
    """
    Para cada año, analiza el último trimestre disponible y muestra:
    - % de universitarios extranjeros sobre extranjeros
    - % de universitarios extranjeros sobre universitarios
    - % sobre el total combinado
    """
    for anio in dict_anio_trimestre:
        trimestre = obtener_ultimo_trimestre(dict_anio_trimestre, anio)
        filas = dict_anio_trimestre[anio][trimestre]

        total_ext, total_univ, total_ext_univ = contar_extranjeros_universitarios(filas)
        p1, p2, p3 = porcentajes_universitarios_extranjeros(total_ext, total_univ, total_ext_univ)

        print(f"Año {anio}, Trimestre {trimestre}")
        print(f"  - % Univ. Extranjeros / Total Extranjeros: {p1:.2f}%")
        print(f"  - % Univ. Extranjeros / Total Univ.: {p2:.2f}%")
        print(f"  - % Univ. Extranjeros / Muestra combinada: {p3:.2f}%\n")

def actividad_2(lista_filas_individual):
    """
    Arma el diccionario año-trimestre y ejecuta el análisis de universitarios extranjeros.
    """
    dict_anio_trimestre = agrupar_por_anio_y_trimestre(lista_filas_individual)
    analizar_universitarios_extranjeros(dict_anio_trimestre)

In [12]:
def es_extranjero(valor_ch15):
    """Devuelve True si la persona nació fuera de Argentina."""
    return valor_ch15 in ['4', '5']

def es_universitario(valor_ch12):
    """Devuelve True si la persona alcanzó nivel universitario o posgrado."""
    return valor_ch12 in ['7', '8']

def contar_extranjeros_universitarios(filas):
    """
    Calcula los totales ponderados de:
    - Extranjeros
    - Universitarios
    - Universitarios extranjeros
    """
    total_extranjeros = total_universitarios = total_universitarios_extranjeros = 0

    for elem in filas:
        pondera = int(elem[9])
        ch12 = elem[19]  # nivel educativo
        ch15 = elem[22]  # lugar de nacimiento

        if es_extranjero(ch15):
            total_extranjeros += pondera
            if es_universitario(ch12):
                total_universitarios_extranjeros += pondera

        if es_universitario(ch12):
            total_universitarios += pondera

    return total_extranjeros, total_universitarios, total_universitarios_extranjeros

def porcentajes_universitarios_extranjeros(total_extranjeros, total_universitarios, total_universitarios_extranjeros):
    """
    Calcula tres porcentajes:
    - % de universitarios extranjeros sobre total de extranjeros
    - % de universitarios extranjeros sobre total de universitarios
    - % de universitarios extranjeros sobre total combinado
    """
    total_muestra = total_extranjeros + total_universitarios

    por_sobre_extranjeros = porcentaje(total_universitarios_extranjeros, total_extranjeros)
    por_sobre_universitarios = porcentaje(total_universitarios_extranjeros, total_universitarios)
    por_sobre_muestra = porcentaje(total_universitarios_extranjeros, total_muestra)

    return round(por_sobre_extranjeros, 2), round(por_sobre_universitarios, 2), round(por_sobre_muestra, 2)

def ver_todos_los_porcentajes(lista_filas_individual):
    """
    Recorre todos los años y trimestres disponibles y muestra los porcentajes.
    """
    dict_anio_trimestre = agrupar_por_anio_y_trimestre(lista_filas_individual)

    print("Porcentajes de universitarios extranjeros por año y trimestre:\n")
    for anio in sorted(dict_anio_trimestre.keys()):
        for trimestre in sorted(dict_anio_trimestre[anio].keys()):
            filas = dict_anio_trimestre[anio][trimestre]
            total_ext, total_univ, total_ext_univ = contar_extranjeros_universitarios(filas)
            p1, p2, p3 = porcentajes_universitarios_extranjeros(total_ext, total_univ, total_ext_univ)

            print(f"Año {anio}, Trimestre {trimestre}")
            print(f"  - % Univ. Extranjeros / Total Extranjeros: {p1:.2f}%")
            print(f"  - % Univ. Extranjeros / Total Univ.: {p2:.2f}%")
            print(f"  - % Univ. Extranjeros / Muestra combinada: {p3:.2f}%\n")

def actividad_2_interactiva(lista_filas_individual):
    """
    Permite al usuario ingresar el año y trimestre deseado y ver los porcentajes.
    También muestra los años y trimestres disponibles.
    Maneja errores si el año o el trimestre no están disponibles.
    """
    dict_anio_trimestre = agrupar_por_anio_y_trimestre(lista_filas_individual)

    print("Años y trimestres disponibles:")
    for anio in sorted(dict_anio_trimestre.keys()):
        trimestres = sorted(dict_anio_trimestre[anio].keys())
        print(f"  - Año {anio}: Trimestres disponibles: {', '.join(trimestres)}")

    anio = input("\nIngrese el año deseado (ej. 2022): ")
    trimestre = input("Ingrese el trimestre deseado (1, 2, 3 o 4): ")

    if anio not in dict_anio_trimestre:
        print(f"\n No hay datos disponibles para el año {anio}.\n")
        return

    if trimestre not in dict_anio_trimestre[anio]:
        print(f"\n No hay datos disponibles para el trimestre {trimestre} del año {anio}.\n")
        return

    filas = dict_anio_trimestre[anio][trimestre]
    total_ext, total_univ, total_ext_univ = contar_extranjeros_universitarios(filas)
    p1, p2, p3 = porcentajes_universitarios_extranjeros(total_ext, total_univ, total_ext_univ)

    print(f"\n Resultados para Año {anio}, Trimestre {trimestre}")
    print(f"  - % Univ. Extranjeros / Total Extranjeros: {p1:.2f}%")
    print(f"  - % Univ. Extranjeros / Total Univ.: {p2:.2f}%")
    print(f"  - % Univ. Extranjeros / Muestra combinada: {p3:.2f}%\n")

In [13]:
ver_todos_los_porcentajes(lista_filas_individual)

Porcentajes de universitarios extranjeros por año y trimestre:

Año 2023, Trimestre 3
  - % Univ. Extranjeros / Total Extranjeros: 23.62%
  - % Univ. Extranjeros / Total Univ.: 7.13%
  - % Univ. Extranjeros / Muestra combinada: 5.48%

Año 2023, Trimestre 4
  - % Univ. Extranjeros / Total Extranjeros: 27.04%
  - % Univ. Extranjeros / Total Univ.: 7.87%
  - % Univ. Extranjeros / Muestra combinada: 6.10%

Año 2024, Trimestre 1
  - % Univ. Extranjeros / Total Extranjeros: 25.61%
  - % Univ. Extranjeros / Total Univ.: 6.80%
  - % Univ. Extranjeros / Muestra combinada: 5.37%

Año 2024, Trimestre 2
  - % Univ. Extranjeros / Total Extranjeros: 20.96%
  - % Univ. Extranjeros / Total Univ.: 5.70%
  - % Univ. Extranjeros / Muestra combinada: 4.48%



In [14]:
# actividad_2_interactiva(lista_filas_individual)

## 3

3. A partir de la información contenida en el dataset informar el año y trimestre donde hubo menor desocupación.

#### Tabla individual  
1- ANO4 N (4) Año de relevamiento (4 dígitos)

2- TRIMESTRE N (1) Ventana de observación  
- = 1° trimestre  
- = 2° trimestre  
- = 3° trimestre  
- = 4° trimestre  

9- PONDERA N (6) Ponderación  

27- ESTADO N (1) Condición de actividad
- 0 = Entrevista individual no realizada (no respuesta al cuestionario individual)
- 1 = Ocupado
- 2 = Desocupado
- 3 = Inactivo
- 4 = Menor de 10 años
______________________________
Columnas usadas: 1 - 2 - 9 - 27

Notas
Población activa = Ocupados + Desocupados  
Tasa de paro o desempleo = (Población desocupada / Población activa) x 100

In [15]:
def calcular_tasa_desocupacion(filas):
    """
    Calcula el total de desocupados y total activos (ocupados + desocupados) ponderados.
    """
    total_desocupados = total_activos = 0

    for fila in filas:
        estado = fila[3]
        pondera = int(fila[2])

        if estado == '2':  # Desocupado
            total_desocupados += pondera
            total_activos += pondera
        elif estado == '1':  # Ocupado
            total_activos += pondera

    return porcentaje(total_desocupados, total_activos)

def buscar_menor_desocupacion(lista_filas_individual):
    """
    Recorre todos los años y trimestres y encuentra el de menor tasa de desocupación.
    """
    agrupados = agrupar_por_anio_y_trimestre(lista_filas_individual)

    menor_tasa = None
    anio_menor = None
    trimestre_menor = None

    for anio in agrupados:
        for trimestre in agrupados[anio]:
            filas = agrupados[anio][trimestre]
            tasa = calcular_tasa_desocupacion(filas)

            if (menor_tasa is None) or (tasa < menor_tasa):
                menor_tasa = tasa
                anio_menor = anio
                trimestre_menor = trimestre

    print(f"\nEl menor porcentaje de desocupación fue de {menor_tasa:.2f}%")
    print(f"Año: {anio_menor}, Trimestre: {trimestre_menor}")

In [16]:
buscar_menor_desocupacion(lista_filas_individual)


El menor porcentaje de desocupación fue de 2.18%
Año: 2024, Trimestre: 1


## 4

4- Ranking de los 5 aglomerados con mayor porcentaje de hogares con dos o más ocupantes con estudios universitarios o superiores finalizados. Información obtenida a partir del par de archivos más recientes.

<span style="color:red;"> 
como seria es oso de "Información obtenida a partir del par de archivos más recientes."
</span>

#### Tabla individual  
CODUSU C (29) Código para distinguir VIVIENDAS,
permite aparearlas con Hogares
y Personas. Además permite hacer el
seguimiento a través de
los trimestres.

NRO_HOGAR N (1) Código para distinguir Hogares, permite
aparearlos con Personas.

COMPONENTE N (2) Número de componente: número de
orden que se asigna a las personas que
conforman cada hogar de la vivienda.
Casos especiales:
51 = Servicio doméstico en hogares
71 = Pensionistas en hogares


1- ANO4 N (4) Año de relevamiento (4 dígitos)

2- TRIMESTRE N (1) Ventana de observación  
- = 1° trimestre  
- = 2° trimestre  
- = 3° trimestre  
- = 4° trimestre  

9- PONDERA N (6) Ponderación  


27- ESTADO N (1) Condición de actividad
- 0 = Entrevista individual no realizada (no respuesta al cuestionario individual)
- 1 = Ocupado
- 2 = Desocupado
- 3 = Inactivo
- 4 = Menor de 10 años

#### Tabla hogares
CODUSU C (29) Código para distinguir viviendas,
permite aparearlas con Hogares y
Personas. Además permite hacer el
seguimiento a través de los trimestres


______________________________
Columnas usadas: 1 - 2 - 9 - 27

<span style="color:red;"> 
Para que cumpla la condición tiene que tener 2 valores con CODUSU, NRO_HOGAR  iguales, NIEVEL_ED Universitario completo y Componentes distintos. Si se cumple todo eso sumar la cantidad pondera del que tenga valor mas bajo entre las filas que coincidan todos esos datos?
</span>


## 5

5. Informar para cada aglomerado el porcentaje de viviendas ocupadas por sus
propietarios.

#### Tabla hogar 
1- ANO4 N (4) Año de relevamiento (4 dígitos)

2- TRIMESTRE N (1) Ventana de observación  
- = 1° trimestre  
- = 2° trimestre  
- = 3° trimestre  
- = 4° trimestre  

7 - AGLOMERADO N (2) Código de Aglomerado
- 02 = Gran La Plata
- 03 = Bahía Blanca - Cerri
- 04 = Gran Rosario
- 05 = Gran Santa Fé
- 06 = Gran Paraná
- 07 = Posadas
- 08 = Gran Resistencia
- 09 = Comodoro Rivadavia - Rada Tilly
- 10 = Gran Mendoza
- 12 = Corrientes
- 13 = Gran Córdoba
- 14 = Concordia
- 15 = Formosa
- 17 = Neuquén – Plottier
- 18 = Santiago del Estero - La Banda
- 19 = Jujuy - Palpalá
- 20 = Río Gallegos
- 22 = Gran Catamarca
- 23 = Gran Salta
- 25 = La Rioja
- 26 = Gran San Luis
- 27 = Gran San Juan
- 29 = Gran Tucumán - Tafí Viejo
- 30 = Santa Rosa – Toay
- 31 = Ushuaia - Río Grande
- 32 = Ciudad Autónoma de Buenos Aires
- 33 = Partidos del GBA
- 34 = Mar del Plata
- 36 = Río Cuarto
- 38 = San Nicolás – Villa Constitución
- 91 = Rawson – Trelew
- 93 = Viedma – Carmen de Patagones

8 - PONDERA N (6) Ponderación

37 - II7 N (2) Régimen de tenencia
- 01 = Propietario de la vivienda y el terreno
- 02 = Propietario de la vivienda solamente
- 03 = Inquilino / arrendatario de la vivienda
- 04 = Ocupante por pago de impuestos / expensas
- 05 = Ocupante en relación de dependencia
- 06 = Ocupante gratuito (con permiso)
- 07 = Ocupante de hecho (sin permiso)
- 08 = Está en sucesión

______________________________
Columnas usadas: 1- 2- 7 - 8 - 37

In [17]:
def aglomerado_mas_grande_en_periodo(filas, año, trimestre):
    """
    Retorna el código del aglomerado con mayor población ponderada
    en el año y trimestre especificados.
    fila[1] = año, fila[2] = trimestre, fila[7] = aglomerado, fila[8] = pondera
    """
    aglo_totales = {}

    for fila in filas:
        if int(fila[1]) == año and int(fila[2]) == trimestre:
            aglo = fila[7]
            pondera = int(fila[8])
            aglo_totales[aglo] = aglo_totales.get(aglo, 0) + pondera

    return max(aglo_totales, key=aglo_totales.get)

def porcentaje_propietarios_en_periodo(filas, año, trimestre):
    """
    Calcula el porcentaje de viviendas ocupadas por propietarios
    en el aglomerado más grande del período dado.
    """
    # fila[1] = año, fila[2] = trimestre, fila[7] = aglomerado, fila[8] = pondera, fila[37] = II7
    aglo_grande = aglomerado_mas_grande_en_periodo(filas, año, trimestre)

    total_ponderado = 0
    propietarios_ponderado = 0

    for fila in filas:
        if int(fila[1]) == año and int(fila[2]) == trimestre and fila[7] == aglo_grande:
            pondera = int(fila[8])
            regimen = fila[37]
            total_ponderado += pondera
            if regimen in ('1', '2'):
                propietarios_ponderado += pondera

    if total_ponderado == 0:
        return 0.0

    return (propietarios_ponderado / total_ponderado) * 100

In [18]:
año, trimestre = obtener_ultimo_periodo(lista_filas_hogar)
porcentaje = porcentaje_propietarios_en_periodo(lista_filas_hogar, año, trimestre)
print(f"En {año} T{trimestre}, el {porcentaje:.2f}% de las viviendas estaban ocupadas por propietarios en el aglomerado más grande.")

En 2024 T2, el 71.03% de las viviendas estaban ocupadas por propietarios en el aglomerado más grande.


## 6 

6. Informar el aglomerado con mayor cantidad de viviendas con más de dos ocupantes
y sin baño. Informar también la cantidad de ellas.

#### Tabla hogar 
7 - AGLOMERADO N (2) Código de Aglomerado
- 02 = Gran La Plata
- 03 = Bahía Blanca - Cerri
- 04 = Gran Rosario
- 05 = Gran Santa Fé
- 06 = Gran Paraná
- 07 = Posadas
- 08 = Gran Resistencia
- 09 = Comodoro Rivadavia - Rada Tilly
- 10 = Gran Mendoza
- 12 = Corrientes
- 13 = Gran Córdoba
- 14 = Concordia
- 15 = Formosa
- 17 = Neuquén – Plottier
- 18 = Santiago del Estero - La Banda
- 19 = Jujuy - Palpalá
- 20 = Río Gallegos
- 22 = Gran Catamarca
- 23 = Gran Salta
- 25 = La Rioja
- 26 = Gran San Luis
- 27 = Gran San Juan
- 29 = Gran Tucumán - Tafí Viejo
- 30 = Santa Rosa – Toay
- 31 = Ushuaia - Río Grande
- 32 = Ciudad Autónoma de Buenos Aires
- 33 = Partidos del GBA
- 34 = Mar del Plata
- 36 = Río Cuarto
- 38 = San Nicolás – Villa Constitución
- 91 = Rawson – Trelew
- 93 = Viedma – Carmen de Patagones

8 - PONDERA N (6) Ponderación

37 - II7 N (2) Régimen de tenencia
- 01 = Propietario de la vivienda y el terreno
- 02 = Propietario de la vivienda solamente
- 03 = Inquilino / arrendatario de la vivienda
- 04 = Ocupante por pago de impuestos / expensas
- 05 = Ocupante en relación de dependencia
- 06 = Ocupante gratuito (con permiso)
- 07 = Ocupante de hecho (sin permiso)
- 08 = Está en sucesión

19 - IV8 N (1) ¿Tiene baño / letrina?
- 1 = Sí
- 2 = No

64 - IX_Tot N (2) Cantidad de miembros del hogar
______________________________
Columnas usadas: 7 - 8 - 37 - 19 - 64

In [19]:
def aglomerado_mas_viviendas_sin_banio(filas, año, trimestre, col_anio=1, col_trimestre=2, col_aglomerado=7, col_pondera=8, col_banio=19, col_miembros=64):
    """
    Recorre todas las filas y devuelve el aglomerado con más viviendas sin baño
    y más de dos ocupantes para un año y trimestre específicos.
    """
    conteo = {}

    for fila in filas:
        anio_fila = int(fila[col_anio])
        trimestre_fila = int(fila[col_trimestre])

        if anio_fila == año and trimestre_fila == trimestre:
            aglomerado = fila[col_aglomerado]
            pondera = int(fila[col_pondera])
            tiene_banio = fila[col_banio]
            miembros = int(fila[col_miembros])

            if tiene_banio == '2' and miembros > 2:
                if aglomerado not in conteo:
                    conteo[aglomerado] = 0
                conteo[aglomerado] += pondera

    if not conteo:
        return None

    aglomerado_max = max(conteo, key=conteo.get)
    cantidad_max = conteo[aglomerado_max]
    return aglomerado_max, cantidad_max

def actividad_6(filas):
    """
    Imprime el aglomerado con más viviendas sin baño y más de dos ocupantes
    del último período del dataset, incluyendo el código, nombre, cantidad,
    año y trimestre.
    """
    # Obtener el último año y trimestre
    año, trimestre = obtener_ultimo_periodo(filas)

    # Obtener el aglomerado con más viviendas sin baño y más de 2 ocupantes
    resultado = aglomerado_mas_viviendas_sin_banio(filas, año, trimestre)

    if resultado is None:
        print(f"No se encontraron viviendas sin baño con más de 2 ocupantes en {año} trimestre {trimestre}.")
        return

    codigo, cantidad = resultado
    nombre = nombre_aglomerado(codigo)

    print(f"Año: {año}, Trimestre: {trimestre}")
    print(f"Aglomerado {codigo} - {nombre}")
    print(f"Cantidad de viviendas sin baño con más de 2 ocupantes: {cantidad}")

actividad_6(lista_filas_hogar)

Año: 2024, Trimestre: 2
Aglomerado 33 - Partidos del GBA
Cantidad de viviendas sin baño con más de 2 ocupantes: 10624


## 7

7. Informar para cada aglomerado el porcentaje de personas que hayan cursado al
menos en nivel universitario o superior.


#### Tabla individual  
1- ANO4 N (4) Año de relevamiento (4 dígitos)

2- TRIMESTRE N (1) Ventana de observación  
- = 1° trimestre  
- = 2° trimestre  
- = 3° trimestre  
- = 4° trimestre  

9 - PONDERA N (6) Ponderación  

8 - AGLOMERADO N (2) Código de aglomerado

26 - NIVEL_ED N (1) Nivel educativo
1 = Primario incompleto (incluye educación especial)
2 = Primario completo
3 = Secundario incompleto
4 = Secundario completo
5 = Superior universitario incompleto
6 = Superior universitario completo
7 = Sin instrucción
9 = Ns/Nr
______________________________
Columnas usadas: 1 - 2 - 8 - 9 - 26


In [20]:
def porcentaje_universitarios_por_aglomerado(filas, año, trimestre, col_anio=1, col_trimestre=2, col_aglomerado=8, col_pondera=9, col_nivel_edu=26):
    
    filas_filtradas = filtrar_por_anio_y_trimestre(filas, año, trimestre)
    
    grupos = agrupar_por_aglomerado(filas_filtradas, col_aglomerado)
    
    for aglo, filas_aglo in grupos.items():
        total_validos = suma_ponderada(filas_aglo, lambda f: f[col_nivel_edu] not in ['7', '9'], col_pondera)
        total_universitarios = suma_ponderada(filas_aglo, lambda f: f[col_nivel_edu] in ['5', '6'], col_pondera)
        
        nombre = nombre_aglomerado(aglo)
        
        if total_validos > 0:
            porcentaje = (total_universitarios / total_validos) * 100
            print(f"{nombre}: {porcentaje:.2f}% con nivel universitario o superior")
        else:
            print(f"{nombre}: sin datos válidos")

porcentaje_universitarios_por_aglomerado(lista_filas_individual, 2024, 2)

Ciudad Autónoma de Buenos Aires: 49.65% con nivel universitario o superior
Partidos del GBA: 23.12% con nivel universitario o superior
Gran Catamarca: 26.14% con nivel universitario o superior
Jujuy - Palpalá: 29.16% con nivel universitario o superior
Gran Córdoba: 34.33% con nivel universitario o superior
Río Cuarto: 31.10% con nivel universitario o superior
Concordia: 19.40% con nivel universitario o superior
Formosa: 24.87% con nivel universitario o superior
Gran Resistencia: 24.16% con nivel universitario o superior
Comodoro Rivadavia - Rada Tilly: 25.36% con nivel universitario o superior
La Rioja: 25.55% con nivel universitario o superior
Rawson - Trelew: 22.06% con nivel universitario o superior
Viedma - Carmen de Patagones: 27.73% con nivel universitario o superior
Mar del Plata: 31.72% con nivel universitario o superior
San Nicolás - Villa Constitución: 23.74% con nivel universitario o superior
Gran Paraná: 33.14% con nivel universitario o superior
Santa Rosa - Toay: 27.27% co

8. Informar las regiones en orden descendente según el porcentaje de inquilinos de
cada una

#### Tabla hogar 
7 - AGLOMERADO N (2) Código de Aglomerado
- 02 = Gran La Plata
- 03 = Bahía Blanca - Cerri
- 04 = Gran Rosario
- 05 = Gran Santa Fé
- 06 = Gran Paraná
- 07 = Posadas
- 08 = Gran Resistencia
- 09 = Comodoro Rivadavia - Rada Tilly
- 10 = Gran Mendoza
- 12 = Corrientes
- 13 = Gran Córdoba
- 14 = Concordia
- 15 = Formosa
- 17 = Neuquén – Plottier
- 18 = Santiago del Estero - La Banda
- 19 = Jujuy - Palpalá
- 20 = Río Gallegos
- 22 = Gran Catamarca
- 23 = Gran Salta
- 25 = La Rioja
- 26 = Gran San Luis
- 27 = Gran San Juan
- 29 = Gran Tucumán - Tafí Viejo
- 30 = Santa Rosa – Toay
- 31 = Ushuaia - Río Grande
- 32 = Ciudad Autónoma de Buenos Aires
- 33 = Partidos del GBA
- 34 = Mar del Plata
- 36 = Río Cuarto
- 38 = San Nicolás – Villa Constitución
- 91 = Rawson – Trelew
- 93 = Viedma – Carmen de Patagones

8 - PONDERA N (6) Ponderación

37 - II7 N (2) Régimen de tenencia
- 01 = Propietario de la vivienda y el terreno
- 02 = Propietario de la vivienda solamente
- 03 = Inquilino / arrendatario de la vivienda
- 04 = Ocupante por pago de impuestos / expensas
- 05 = Ocupante en relación de dependencia
- 06 = Ocupante gratuito (con permiso)
- 07 = Ocupante de hecho (sin permiso)
- 08 = Está en sucesión

64 - IX_Tot N (2) Cantidad de miembros del hogar

9 - IV1 N (1) Tipo de vivienda (por observación)
1. casa
2. departamento
3. pieza de inquilinato
4. pieza en hotel / pensión
5. local no construido para habitación

______________________________
Columnas usadas: 7 - 8 - 9 - 37 - 64

In [21]:
def informar_porcentaje_inquilinos_por_aglomerado(filas, anio, trimestre):
    """
    Informa los aglomerados ordenados de forma descendente según el porcentaje de inquilinos
    para un período determinado (año y trimestre).
        
    Retorna:
    - Lista de tuplas: [(nombre_aglomerado, porcentaje_inquilinos), ...]
    """
    # Filtramos los datos por año y trimestre
    filas_periodo = filtrar_por_anio_y_trimestre(filas, anio, trimestre)

    # Agrupamos por aglomerado (columna 7)
    aglomerados = agrupar_por_aglomerado(filas_periodo, 7)

    resultados = []

    for codigo, hogares in aglomerados.items():
        total_ponderado = suma_ponderada(hogares, lambda f: True, 8) # lambda f: True para que sume todos sin filtrar nada
        total_inquilinos = suma_ponderada(hogares, lambda f: f[37] == '3', 8) # lambda f: f[37] == '3' solo pondera cuando f[37] == '3' 

        if total_ponderado > 0:
            porcentaje_inq = (total_inquilinos/ total_ponderado) * 100
            nombre = nombre_aglomerado(codigo)
            resultados.append((nombre, porcentaje_inq))

    # Ordenamos en forma descendente por porcentaje
    resultados.sort(key=lambda x: x[1], reverse=True)

    return resultados

# Suponiendo que tenés tu lista `filas` cargada:
anio, trimestre = obtener_ultimo_periodo(lista_filas_hogar)
res = informar_porcentaje_inquilinos_por_aglomerado(lista_filas_hogar, anio, trimestre)

for nombre, porc in res:
    print(f"{nombre}: {porc:.2f}% de inquilinos")

Ushuaia - Río Grande: 36.07% de inquilinos
Río Gallegos: 35.81% de inquilinos
Ciudad Autónoma de Buenos Aires: 35.15% de inquilinos
Río Cuarto: 34.49% de inquilinos
Gran Córdoba: 30.64% de inquilinos
Bahía Blanca - Cerri: 28.26% de inquilinos
Gran Mendoza: 26.90% de inquilinos
Santa Rosa - Toay: 24.23% de inquilinos
Comodoro Rivadavia - Rada Tilly: 23.61% de inquilinos
Gran San Luis: 23.27% de inquilinos
Gran Santa Fé: 23.21% de inquilinos
Rawson - Trelew: 22.94% de inquilinos
Neuquén - Plottier: 22.90% de inquilinos
Mar del Plata: 22.66% de inquilinos
Viedma - Carmen de Patagones: 22.46% de inquilinos
Corrientes: 21.49% de inquilinos
Gran Paraná: 21.05% de inquilinos
Gran Rosario: 19.94% de inquilinos
Gran Salta: 19.85% de inquilinos
Posadas: 19.17% de inquilinos
Gran La Plata: 19.07% de inquilinos
Gran Tucumán - Tafí Viejo: 18.10% de inquilinos
Gran San Juan: 17.07% de inquilinos
La Rioja: 15.29% de inquilinos
Partidos del GBA: 15.15% de inquilinos
San Nicolás - Villa Constitución: 1

In [22]:
# agrupamos por aglomerado y guardamos el resultado
grupos = agrupar_por_aglomerado(lista_filas_hogar, col_aglomerado=7)

# imprimimos solo las claves (aglomerados detectados)
def imprimir_claves_grupos(grupos):
    print("Aglomerados encontrados:")
    for clave in grupos.keys():
        print(clave)

imprimir_claves_grupos(grupos)


Aglomerados encontrados:
7
32
2
14
15
5
27
18
26
20
29
33
8
23
91
3
4
31
34
12
30
38
17
19
36
93
13
22
9
10
25
6


In [23]:
anio, trimestre = obtener_ultimo_periodo(lista_filas_hogar)
print (anio)
print(trimestre)

2024
2


In [24]:
aglomerados = agrupar_por_aglomerado(lista_filas_hogar, 7)

In [25]:
mostrar_valores_columna(header_hogar,lista_filas_hogar,37)

Columna II7
Fila 1: 1
Fila 2: 1
Fila 3: 3
Fila 4: 1
Fila 5: 1
Fila 6: 2
Fila 7: 3
Fila 8: 1
Fila 9: 2
Fila 10: 1


9. Pedir al usuario que seleccione un aglomerado y a partir de la información contenida
retornar una tabla que contenga la cantidad de personas mayores de edad según su
nivel de estudios alcanzados

A modo de ejemplo:

| Año  | Trimestre | Primario incompleto | Primario completo | Secundario incompleto | Secundario completo | Superior o universitario |
|------|-----------|----------------------|--------------------|------------------------|----------------------|----------------------------|
| 2020 | 1         |                      |                    |                        |                      |                            |
| 2020 | 2         |                      |                    |                        |                      |                            |
| 2020 | 3         |                      |                    |                        |                      |                            |
| 2020 | 4         |                      |                    |                        |                      |                            |
| 2021 | 1         |                      |                    |                        |                      |                            |
| 2021 | 2         |                      |                    |                        |                      |                            |


#### Tabla individual  
1- ANO4 N (4) Año de relevamiento (4 dígitos)

2- TRIMESTRE N (1) Ventana de observación  
- = 1° trimestre  
- = 2° trimestre  
- = 3° trimestre  
- = 4° trimestre  

8 - AGLOMERADO N (2) Código de aglomerado

9 - PONDERA N (6) Ponderación  

13- CH06 N (2) ¿Cuántos años cumplidos tiene?

26 - NIVEL_ED N (1) Nivel educativo
1 = Primario incompleto (incluye educación especial)
2 = Primario completo
3 = Secundario incompleto
4 = Secundario completo
5 = Superior universitario incompleto
6 = Superior universitario completo
7 = Sin instrucción
9 = Ns/Nr
______________________________
Columnas usadas: 1 - 2 - 8 - 9 - 13 - 26

In [26]:
def tabla_porcentaje_secundario_incompleto(filas_individual, aglomerado):
    tabla = {}

    # Filtrar por aglomerado
    filas_filtradas = filtrar_por_condicion(filas_individual, lambda f: int(f[8]) == aglomerado)

    # Filtrar por mayores de edad (edad >= 18)
    filas_filtradas = filtrar_por_condicion(filas_filtradas, lambda f: int(f[13]) >= 18)

    #  Contar según nivel educativo para cada año y trimestre
    for fila in filas_filtradas:
        ano = int(fila[1])         # Año
        trimestre = int(fila[2])   # Trimestre
        pondera = float(fila[9])   # Factor de expansión
        nivel = fila[40]           # Nivel educativo

        clave = (ano, trimestre)
        if clave not in tabla:
            tabla[clave] = {
                'Primario incompleto': 0,
                'Primario completo': 0,
                'Secundario incompleto': 0,
                'Secundario completo': 0,
                'Superior o universitario': 0
            }

        if nivel == '1':
            tabla[clave]['Primario incompleto'] += pondera
        elif nivel == '2':
            tabla[clave]['Primario completo'] += pondera
        elif nivel == '3':
            tabla[clave]['Secundario incompleto'] += pondera
        elif nivel == '4':
            tabla[clave]['Secundario completo'] += pondera
        elif nivel in ['5', '6']:
            tabla[clave]['Superior o universitario'] += pondera

    # Imprimir la tabla
    print(f"\nTabla de personas mayores de edad por nivel educativo en el aglomerado {aglomerado}:\n")
    print("| {:<6} | {:<9} | {:>22} | {:>20} | {:>24} | {:>22} | {:>28} |".format(
        "Año", "Trimestre", "Primario incompleto", "Primario completo",
        "Secundario incompleto", "Secundario completo", "Superior o universitario"))
    print("|" + "-"*8 + "|" + "-"*11 + "|" + "-"*24 + "|" + "-"*22 + "|" + "-"*26 + "|" + "-"*24 + "|" + "-"*30 + "|")

    for clave in sorted(tabla.keys()):
        año, trim = clave
        fila = tabla[clave]
        print("| {:<6} | {:<9} | {:>22.0f} | {:>20.0f} | {:>24.0f} | {:>22.0f} | {:>28.0f} |".format(
            año, trim,
            fila['Primario incompleto'],
            fila['Primario completo'],
            fila['Secundario incompleto'],
            fila['Secundario completo'],
            fila['Superior o universitario']))
        
tabla_porcentaje_secundario_incompleto(lista_filas_individual, 32)


Tabla de personas mayores de edad por nivel educativo en el aglomerado 32:

| Año    | Trimestre |    Primario incompleto |    Primario completo |    Secundario incompleto |    Secundario completo |     Superior o universitario |
|--------|-----------|------------------------|----------------------|--------------------------|------------------------|------------------------------|
| 2023   | 3         |                   6544 |               668567 |                        0 |                      0 |                            0 |
| 2023   | 4         |                  23103 |               648761 |                        0 |                      0 |                            0 |
| 2024   | 1         |                  11320 |               684609 |                        0 |                      0 |                            0 |
| 2024   | 2         |                  15204 |               682996 |                        0 |                      0 |                            0 |

## 10

10. Pedir al usuario que seleccione dos aglomerados y a partir de la información
contenida retornar una tabla que contenga el porcentaje de personas mayores de
edad con secundario incompleto.


In [27]:
# 1. Contador por año y trimestre
def contar_secundario_incompleto(filas):
    resultados = {}
    for f in filas:
        año = int(f[1])
        trimestre = int(f[2])
        pondera = float(f[9])
        nivel = f[40]  # Nivel educativo

        clave = (año, trimestre)
        if clave not in resultados:
            resultados[clave] = {'total': 0, 'incompleto': 0}

        resultados[clave]['total'] += pondera
        if nivel in ['1', '2', '3']:  # No terminó el secundario
            resultados[clave]['incompleto'] += pondera

    return resultados


# 2. Calcula porcentajes por aglomerado
def calcular_porcentajes_por_aglomerado(filas_individual, aglo1, aglo2):
    # Filtramos mayores de edad y por aglomerado
    filas_mayores = [f for f in filas_individual if int(f[13]) >= 18]

    filas_aglo1 = [f for f in filas_mayores if int(f[8]) == aglo1]
    filas_aglo2 = [f for f in filas_mayores if int(f[8]) == aglo2]

    # Usamos la función auxiliar para contar
    datos_aglo1 = contar_secundario_incompleto(filas_aglo1)
    datos_aglo2 = contar_secundario_incompleto(filas_aglo2)

    # Unimos claves para poder comparar año/trimestre
    claves = set(datos_aglo1.keys()).union(datos_aglo2.keys())
    resultados = {}

    for clave in sorted(claves):
        total1 = datos_aglo1.get(clave, {'total': 0, 'incompleto': 0})
        total2 = datos_aglo2.get(clave, {'total': 0, 'incompleto': 0})

        porc1 = (total1['incompleto'] / total1['total'] * 100) if total1['total'] > 0 else 0
        porc2 = (total2['incompleto'] / total2['total'] * 100) if total2['total'] > 0 else 0

        resultados[clave] = (porc1, porc2)

    return resultados


# 3. Mostrar tabla final
def mostrar_tabla_porcentajes(resultados, aglo1, aglo2):
    nombre1 = nombre_aglomerado(str(aglo1))
    nombre2 = nombre_aglomerado(str(aglo2))

    print(f"\nComparación de % de personas mayores sin secundario completo")
    print(f"Aglomerado {aglo1}: {nombre1}  vs  Aglomerado {aglo2}: {nombre2}\n")
    print("| {:<6} | {:<9} | {:>30} | {:>30} |".format(
        "Año", "Trimestre", f"% sin secundario ({nombre1})", f"% sin secundario ({nombre2})"))
    print("|" + "-"*8 + "|" + "-"*11 + "|" + "-"*32 + "|" + "-"*32 + "|")

    for (año, trim), (p1, p2) in sorted(resultados.items()):
        print("| {:<6} | {:<9} | {:>30.2f} | {:>30.2f} |".format(año, trim, p1, p2))



In [28]:
resultados = calcular_porcentajes_por_aglomerado(lista_filas_individual, 12, 13)
mostrar_tabla_porcentajes(resultados, 12, 13)


Comparación de % de personas mayores sin secundario completo
Aglomerado 12: Corrientes  vs  Aglomerado 13: Gran Córdoba

| Año    | Trimestre |  % sin secundario (Corrientes) | % sin secundario (Gran Córdoba) |
|--------|-----------|--------------------------------|--------------------------------|
| 2023   | 3         |                          40.75 |                          32.63 |
| 2023   | 4         |                          40.83 |                          31.83 |
| 2024   | 1         |                          41.22 |                          32.54 |
| 2024   | 2         |                          40.56 |                          32.49 |


## 11

11. Pedir al usuario que seleccione un año, y busque en el último trimestre almacenado
del mencionado año, el aglomerado con mayor porcentaje de viviendas de “Material
precario” y el aglomerado con menor porcentaje de viviendas de “Material precario”.

* integrador seccion A: 8. Se debe generar una nueva columna llamada MATERIAL_TECHUMBRE que indica el tipo de hogar basado en el campo V4:
- 5 a 7: "Material precario".
- 1 a 4: "Material durable".
- 9: “No aplica”.

47 - V4 N (2) La cubierta exterior del techo es de...
1. membrana / cubierta asfáltica
2. baldosa / losa sin cubierta
3. pizarra / teja
4. chapa de metal sin cubierta
5. chapa de brocemento / plástico
6. chapa de cartón
7. saña / tabla / paja con barro / paja
sola
9. N/S. Departamento en propiedad
horizontal

In [None]:
# def aglomerado_extremos_vivienda_precaria(filas, anio_input, col_ano=1, col_trim=2, 
#                                           col_aglo=7, col_techo=47, col_pondera=8):
#     techo_precario = {'5', '6', '7'}
#     datos = {}

#     # Buscar el último trimestre registrado del año ingresado
#     trimestres_disponibles = set()
#     for fila in filas:
#         if fila[col_ano] == anio_input:
#             trimestres_disponibles.add(int(fila[col_trim]))

#     if not trimestres_disponibles:
#         print(f"No hay datos para el año {anio_input}.")
#         return

#     ultimo_trimestre = max(trimestres_disponibles)

#     # Acumular totales y precarias por aglomerado
#     for fila in filas:
#         if fila[col_ano] != anio_input or int(fila[col_trim]) != ultimo_trimestre:
#             continue

#         aglo = fila[col_aglo]
#         techo = fila[col_techo]
#         pondera = int(fila[col_pondera])

#         if aglo not in datos:
#             datos[aglo] = {'total': 0, 'precarias': 0}

#         datos[aglo]['total'] += pondera
#         if techo in techo_precario:
#             datos[aglo]['precarias'] += pondera

#     # Calcular porcentajes y buscar extremos
#     porcentajes = {}
#     for aglo, conteos in datos.items():
#         if conteos['total'] > 0:
#             porcentaje = (conteos['precarias'] / conteos['total']) * 100
#             porcentajes[aglo] = porcentaje

#     if not porcentajes:
#         print("No hay datos suficientes para calcular porcentajes.")
#         return

#     aglo_max = max(porcentajes, key=porcentajes.get)
#     aglo_min = min(porcentajes, key=porcentajes.get)

#     print(f"\nAño: {anio_input}, Trimestre: {ultimo_trimestre}")
#     print(f"Aglomerado con mayor porcentaje de viviendas precarias: {aglo_max} ({porcentajes[aglo_max]:.2f}%)")
#     print(f"Aglomerado con menor porcentaje de viviendas precarias: {aglo_min} ({porcentajes[aglo_min]:.2f}%)")


# aglomerado_extremos_vivienda_precaria(filas_hogar, '2024')

12. A partir de la información del último trimestre almacenado en el sistema se debe
retornar para cada aglomerado el porcentaje de jubilados que vivan en una vivienda
con CONDICION_DE_HABITABILIDAD insuficiente

TABLA HOGAR
En la seccion A en el ejercicio 10 se agrega la columna Condicion_de_habitalidad que clasifica en insuficiente, regular, saludables y buena.

TABLA INDIVIDUAL:
CAT_INAC N (1) Categoría de inactividad
1 = Jubilado / Pensionado
2 = Rentista
3 = Estudiante
4 = Ama de casa
5 = Menor de 6 años
6 = Discapacitado
7 = Otros


13. Solicitar un año al usuario y a partir de la información del último trimestre de dicho
ejercicio informar la cantidad de personas que hayan cursado nivel universitario o
superior y que vivan en una vivienda con CONDICION_DE_HABITABILIDAD
insuficiente