<table align="left">
  <td>
    <a href="https://colab.research.google.com/github/ageron/handson-ml3/blob/main/tools_numpy.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>
  </td>
  <td>
    <a target="_blank" href="https://kaggle.com/kernels/welcome?src=https://github.com/ageron/handson-ml3/blob/main/tools_numpy.ipynb"><img src="https://kaggle.com/static/images/open-in-kaggle.svg" /></a>
  </td>
</table>

# Introducci√≥n a `pd.crosstab()` para an√°lisis de estratificaci√≥n social 

`pd.crosstab()` es **clave** para pasar de la exploraci√≥n descriptiva simple a la **lectura estructural de la estratificaci√≥n social**.
Este es un **dise√±o de actividad did√°ctica** coherente con este curso, con **conceptualizaci√≥n + adquisici√≥n de habilidades**, y f√°cilmente integrable a un cuaderno Jupyter.

---



# Dise√±o de actividad did√°ctica



## `pd.crosstab()` para an√°lisis de datos sociales con estratificaci√≥n

---

## 1. Nombre de la actividad

**‚ÄúLeer la estructura social a trav√©s de tablas de contingencia‚Äù**

---



## 2. Ubicaci√≥n en el curso

* Curso: **An√°lisis de datos sociales con estratificaci√≥n**
* Momento:
  Despu√©s de:

  * `value_counts()`
  * `groupby()`

  Antes de:

  * OLS (`smf.ols`)
  * An√°lisis inferencial (p-valores)




# 3. Objetivo de aprendizaje

## Objetivo conceptual



Que el estudiante **comprenda qu√© es una tabla de contingencia** y c√≥mo permite **analizar relaciones entre variables categ√≥ricas**, fundamentales en el estudio de la estratificaci√≥n social.



## Objetivo procedimental (habilidades)

Que el estudiante **use correctamente `pd.crosstab()`** para:

* construir tablas de contingencia
* obtener frecuencias absolutas y relativas
* interpretar patrones de desigualdad social

---



## 4. Conocimientos previos requeridos

El estudiante debe saber:

* qu√© es una variable categ√≥rica
* usar `value_counts()`
* crear y explorar un DataFrame
* nociones b√°sicas de estrato, g√©nero, educaci√≥n

---



# 5. Marco conceptual (lectura guiada)



## Concepto clave

En ciencias sociales, muchas preguntas se formulan como:

> *¬øC√≥mo se distribuye una caracter√≠stica social **dentro de** otra?*



Ejemplos:

* ¬øC√≥mo se distribuye el **nivel educativo** seg√∫n el **estrato**?
* ¬øC√≥mo se distribuye el **g√©nero** por **condici√≥n laboral**?



Esto se formaliza mediante una **tabla de contingencia**.





# 6. Introducci√≥n a `pd.crosstab()`



## Sintaxis b√°sica


In [3]:

pd.crosstab(filas, columnas)



NameError: name 'pd' is not defined


## Interpretaci√≥n



* Filas ‚Üí primera variable categ√≥rica
* Columnas ‚Üí segunda variable categ√≥rica
* Celdas ‚Üí frecuencia conjunta

---



## 7. Dataset de trabajo (contexto social)

### Situaci√≥n problema

> Se cuenta con una base de datos simulada de una encuesta social.
> Se desea explorar la **estructura de la estratificaci√≥n social** antes de ajustar modelos estad√≠sticos.



In [None]:
import pandas as pd
import numpy as np

np.random.seed(42)
n = 300

df = pd.DataFrame({
    "genero": np.random.choice(["Hombre", "Mujer"], n, p=[0.48, 0.52]),
    "estrato": np.random.choice([1, 2, 3, 4, 5, 6], n,
                                p=[0.35, 0.30, 0.18, 0.10, 0.05, 0.02]),
    "educacion": np.random.choice(
        ["Primaria", "Secundaria", "T√©cnica", "Universitaria", "Posgrado"],
        n,
        p=[0.25, 0.35, 0.15, 0.20, 0.05]
    )
})

df.head()



## 8. Actividad 1: tabla de contingencia b√°sica



### Pregunta gu√≠a

> ¬øC√≥mo se distribuye el **nivel educativo** seg√∫n el **estrato socioecon√≥mico**?


In [2]:

pd.crosstab(df["estrato"], df["educacion"])



NameError: name 'pd' is not defined


### Lectura conceptual

* Cada fila es un estrato
* Cada columna es un nivel educativo
* Cada celda representa una **frecuencia social conjunta**

---



# 9. Actividad 2: frecuencias relativas (normalizaci√≥n)



## Normalizaci√≥n por filas


In [4]:
import pandas as pd 
pd.crosstab(
    df["estrato"],
    df["educacion"],
    normalize="index"
)


NameError: name 'df' is not defined


### Interpretaci√≥n social

> ‚ÄúDado que una persona pertenece a un estrato espec√≠fico, ¬øcu√°l es la probabilidad de que tenga cierto nivel educativo?‚Äù

üìå Aqu√≠ aparece claramente la **estratificaci√≥n educativa**.

---

## 10. Actividad 3: g√©nero y estrato

```python
pd.crosstab(
    df["genero"],
    df["estrato"],
    normalize="index"
)
```

### Discusi√≥n guiada

* ¬øLa distribuci√≥n por estrato es similar entre hombres y mujeres?
* ¬øQu√© patrones sugieren desigualdad estructural?

---

## 11. Actividad 4: tablas con totales

```python
pd.crosstab(
    df["estrato"],
    df["educacion"],
    margins=True
)
```

### Habilidad adquirida

Interpretar **totales marginales**, fundamentales para:

* an√°lisis descriptivo
* contraste con modelos posteriores

---

## 12. Comparaci√≥n conceptual clave

| M√©todo           | ¬øQu√© responde?                                 |
| ---------------- | ---------------------------------------------- |
| `value_counts()` | ¬øC√≥mo se distribuye una variable?              |
| `groupby()`      | ¬øC√≥mo se resume una variable por grupos?       |
| `pd.crosstab()`  | ¬øC√≥mo se relacionan dos variables categ√≥ricas? |

---

## 13. Actividad de cierre (metacognitiva)

### Preguntas reflexivas

1. ¬øQu√© informaci√≥n ofrece `pd.crosstab()` que no ofrece `value_counts()`?
2. ¬øPor qu√© es indispensable antes de usar OLS?
3. ¬øQu√© riesgos hay en interpretar solo promedios sin ver tablas de contingencia?

---

## 14. Proyecci√≥n (conexi√≥n con el resto del curso)

Esta actividad prepara al estudiante para:

* justificar la inclusi√≥n de variables categ√≥ricas en OLS
* interpretar coeficientes como **brechas estructurales**
* comprender por qu√© los p-valores **no sustituyen** el an√°lisis descriptivo

---

## 15. Cierre pedag√≥gico

> **`pd.crosstab()` no es solo una funci√≥n t√©cnica:
> es una herramienta para leer la estructura social.**

Conecta directamente:
[
\text{Datos} ;\rightarrow; \text{Estructura social} ;\rightarrow; \text{Modelo estad√≠stico}
]

---

Si quieres, en el siguiente paso puedo:

* üìä Integrar esta actividad con **visualizaciones (heatmaps)**
* üìò Dise√±ar una **r√∫brica de evaluaci√≥n**
* üßÆ Conectarla con **chi-cuadrado de independencia**
* üîÅ Traducirla a **STATA (`tabulate`)**

Este dise√±o encaja perfectamente con tu enfoque cr√≠tico y formativo en an√°lisis de datos sociales.
