# Tablas de Frecuencias Relativas Conjuntas

\

## Tablas de Frecuencias Relativas Conjuntas para 2 variables

\

Vamos a crear una función en R a la que le metemos un par de variables y
nos devuelve una tabla con las frecuencias relativas conjuntas de las
dos variables.

\

Las caracteristicas de la función son las siguientes:

-   **Entrada:**  matriz de datos $X$

-   **Entrada:**  variables $V1$ y $V2$ de $X$

-   $V1$ y $V2$ deben estar cargadas en R como vectores

-   $V1$ y $V2$ pueden ser variables categoricas o cuantitativas
    categorizadas

-   El recorrido de $V1$ tiene que ser $0:p1$ , con $p1=1,2,3,...$

-   El recorrido de $V2$ tiene que ser $0:p2$ , con $p2=1,2,3,...$

-   **Entrada:**  $p1$ , $p2$

-   $V1$ es la variable de la parte superior (columnas) de la tabla

-   $V2$ es la variable de la parte inferior (filas) de la tabla

\

```{r, message=FALSE}
Tabla_Frecuencias_Relativas_Conjuntas_2_Variables <- function(X, V1, V2, p1, p2){

tabla<- matrix(NA, nrow=p2+1, ncol=p1+1 )

for(i in 0:p2){
  for(j in 0:p1){
    
tabla[i+1,j+1] <- ( dim( ( X %>% select(V1,V2) %>% filter(V1==j & V2==i) ) )[1] / dim(X)[1] )
  }
}

rownames(tabla)<-0:p2
colnames(tabla)<-0:p1
 
print("V1 esta en la parte superior (columnas) de la tabla y V2 en la parte inferior (filas)")

tabla <- as.data.frame(tabla)

return(tabla) 
}
```

\

**Ejemplo 1:** Dos variables categoricas

```{r, message=FALSE}
Datos$edad <- recode(Datos$edad, "1"="0", "2"="1", "3"="2", "4"="3")
Datos$edad<- as.double( Datos$edad )
edad<-Datos$edad

Datos$genero <- recode(Datos$genero, "1"="0", "2"="1" )
Datos$genero <- as.double( Datos$genero )
genero <- Datos$genero

Tabla_Frecuencias_Relativas_Conjuntas_2_Variables(X=Datos, V1=edad , V2=genero, p1=3, p2=1 )
```


Por ejemplo, la proporción de individuos que son hombres (genero=0) y mayores de 60 años (edad=3) es 0.107

\

**Ejemplo 2:** Una variable categorica y otra cuantitativa

Lo primero es categorizar la variable cuantitativa, para ello aplicamos
una regla facil de categorizacion como la de la media

```{r}
L<- c(min(Datos$ingresos), mean(Datos$ingresos), max(Datos$ingresos))

b<-cut(Datos$ingresos , breaks = L , include.lowest = T)

ingresos_categorizados_regla_media <- recode(b, "[-1e+03,1.41e+04]"=0 , "(1.41e+04,5.85e+04]"=1)
```

Hay que añadir la variable *ingresos* categorizada a la matriz de datos

```{r}
Datos <- cbind(Datos, ingresos_categorizados_regla_media)
```

```{r}
Tabla_Frecuencias_Relativas_Conjuntas_2_Variables(X=Datos, V1=ingresos_categorizados_regla_media , V2=genero, p1=1, p2=1 )
```

Por ejemplo, la proporción de individuos que son hombres (genero=0) con ingresos superiores  a la media (ingresos_categorizados_regla_media=1)  es 0.21

Comprobación:

```{r}
# Calculamos manualmente la entrada (V1=0, V2=0)

 ( dim( ( Datos %>% select(ingresos_categorizados_regla_media, genero) %>% filter(ingresos_categorizados_regla_media==0 & genero==0) ) )[1] / dim(Datos)[1] )
```

Para dos variables cuantitativas seria un procedimiento analogo.

\

## Tablas de Frecuencias Relativas Conjuntas para 3 variables:

\

Vamos a crear una función en R a la que le metemos tres variables y nos
devuelve una tabla con las frecuencias relativas conjuntas de las tres
variables, pero considerando un valor fijo de una de ellas.

\

Las caracteristicas de la función son las siguientes:

-   **Entrada:**  matriz de datos $X$

-   **Entrada:**  variables $V1$ , $V2$ y $V3$ de $X$

-   $V1$ , $V2$ y $V3$ deben estar cargadas en R como vectores

-   $V1$ , $V2$ y $V3$ pueden ser variables categoricas o cuantitativas
    categorizadas

-   El recorrido de $V1$ tiene que ser $0:p1$ , con $p1=1,2,3,...$

-   El recorrido de $V2$ tiene que ser $0:p2$ , con $p2=1,2,3,...$

-   El recorrido de $V3$ tiene que ser $0:p2$ , con $p3=1,2,3,...$

-   **Entrada:**  $p1$ , $p2$, $p3$

-   $V1$ es la variable de la parte superior (columnas) de la tabla

-   $V2$ es la variable de la parte inferior (filas) de la tabla

-   $V3$ es la variable cuyo valor se fija

-   **Entrada**  el valor fijado de $V3$ (*valor_fijado_V3*)

\

```{r}
Tabla_Frecuencias_Relativas_Conjuntas_3_Variables <- function(X, V1, V2, p1, p2, V3, valor_fijado_V3){

tabla<- matrix(NA, nrow=p2+1, ncol=p1+1 )

    
for(i in 0:p2){
  for(j in 0:p1){
   
    tabla[i+1,j+1] <- ( dim( ( X  %>% filter( V1==j & V2==i & V3==valor_fijado_V3 ) ) )[1] / dim(X)[1] )

  }
}
 rownames(tabla)<-0:p2
 colnames(tabla)<-0:p1
 
 print("Tabla de contingencia conjunta entre las variables V1 , V2 y V3, donde V1 esta en la parte superior (columnas) de la tabla y V2 en la inferior (filas), y V3 toma siempre un mismo valor fijado")
 
 tabla <- as.data.frame(tabla)
 
 return(tabla) 
}

```

\

**Ejemplo:** una variable cuantitativa y dos variables categoricas

```{r}
Tabla_Frecuencias_Relativas_Conjuntas_3_Variables(X=Datos, V1= ingresos_categorizados_regla_media , V2= genero , p1=1, p2=1, V3= edad, valor_fijado_V3=3)
```

Por ejemplo, la proporción de individuos que son hombres (genero=0) con ingresos superiores  a la media (ingresos_categorizados_regla_media=1) y mayores de 60 años (edad=3) es 0.03

Comprobación:

```{r}
# Calculamos manualmente la entrada (V1=0, V2=0, V3=3)

( dim( ( Datos  %>% filter( ingresos_categorizados_regla_media==0 & genero==0 & edad==3 ) ) )[1] / dim(Datos)[1] )
```

\

Se puede extender esta idea a mas dimensiones (4,5,6... variables),
aunque no es habitual un analisis con mas de 3 varibles.

\

# Tabla de Frecuencias Relativas Condicionadas

\

## Tabla de Frecuencias Relativas Condicionadas con 2 variables

\

La idea es obtener una tabla de frecuencias relativas para 2 variables,
$V1$ y $V2$, donde $V1$ condiciona a $V2$ , $(V2 | V1)$.

\

Las caracteristicas de la función son las siguientes:

-   **Entrada:**  matriz de datos $X$

-   **Entrada:**  variable $V1$

-   **Entredas**  $V2\_indice$ es el indice de la variable V2 , si la
    variable $V2$ ocupa la columna 6 en $X$, entonces V2_indice=6

-   $V1$ debe estar cargada en R como vector

-   $V1$ y $V2$ pueden ser variables categoricas o cuantitativas
    categorizadas

-   El recorrido de $V1$ tiene que ser $0:p1$ , con $p1=1,2,3,...$

-   El recorrido de $V2$ tiene que ser $0:p2$ , con $p2=1,2,3,...$

-   **Entrada:**  $p1$ y $p2$

-   $V1$ es la variable que **condiciona**, la de la parte superior
    (columnas) de la tabla

-   $V2$ es la variable de la parte inferior (filas) de la tabla

\

```{r}
Tabla_Frecuencias_Relativas_Condicionadas_2_Variables <- function(X, V1, V2_indice, p1, p2 ){

tabla<- matrix(NA, nrow=p2+1, ncol=p1+1 )

for(i in 0:p2){
  for(j in 0:p1){
  
    X_new <- X %>% filter( V1==j)
     
    V2_new<- X_new[, V2_indice]
    
    tabla[i+1,j+1] <- (dim( ( X_new  %>% filter(V2_new==i) ) )[1] / dim(X_new)[1])
  }
}

 rownames(tabla)<-0:p2
 colnames(tabla)<-0:p1
 
print(" V1  es la variable que condiciona y esta en la parte superior (columnas) de la tabla y  V2 en la inferior (filas)")
 
 tabla <- as.data.frame(tabla)

 return(tabla) 
}
```



```{r}
Tabla_Frecuencias_Relativas_Condicionadas_2_Variables(Datos, V1=genero, V2_indice=9, p1=1, p2=1)

# La variable V2 es la de indice 9 de la matriz de datos, que es la variable ingresos categorizada con la regla de la media. 
```

Por ejemplo, la proporción de personas con ingresos superiores  a la media (ingresos_categorizados_regla_media=1), dentro del grupo de los hombres (genero=0)  es 0.43



Comprobación:

```{r}
# Comprobamos cual es la variable V2 usada en el codigo anterior

names(Datos %>% select(9))
```

```{r}
# Calculamos manualmente la entrada (V1=0, V2=0)

dim((Datos %>% filter(genero==0))%>% filter(ingresos_categorizados_regla_media==0))[1] / dim((Datos %>% filter(genero==0)))[1]
```

## Tablas de Frecuencias Relativas Condicionadas con 3 variables

La idea es obtener una tabla de frecuencias relativas para 3 variables,
$V1$ , $V2$ y $V3$, donde $V1$ y $V3$ condicionan a $V2$ ,
$(V2 | V1 , V3 )$, y $V3$ tiene un valor fijado.

\

Las caracteristicas de la función son las siguientes:

-   **Entrada:**  matriz de datos $X$

-   **Entrada:**  variable $V1$ y $V3$

-   **Entredas**  $V2\_indice$ es el indice de la variable V2 , si la
    variable $V2$ ocupa la columna 6 en $X$, entonces V2_indice=6

-   $V1$ y $V3$ debe estar cargada en R como vector

-   $V1$, $V2$ y $V3$ pueden ser variables categoricas o cuantitativas
    categorizadas

-   El recorrido de $V1$ tiene que ser $0:p1$ , con $p1=1,2,3,...$

-   El recorrido de $V2$ tiene que ser $0:p2$ , con $p2=1,2,3,...$

-   El recorrido de $V3$ tiene que ser $0:p3$ , con $p3=1,2,3,...$

-   **Entrada:**  $p1$ , $p2$

-   $V1$ es una de las dos variables que **condicionan**, la de la parte
    superior (columnas) de la tabla

-   $V3$ es la otra variable que condiciona, pero tiene un valor fijado

-   $V2$ es la variable de la parte inferior (filas) de la tabla

\

```{r}
Tabla_Frecuencias_Relativas_Condicionadas_3_Variables <- function(X, V1, V2_indice, p1, p2 , V3, valor_fijado_V3 ){

tabla<- matrix(NA, nrow=p2+1, ncol=p1+1 )

 
for(i in 0:p2){
  for(j in 0:p1){
  
     X_new <- X %>% filter( V1==j & V3==valor_fijado_V3)
     
     V2_new<- X_new[, V2_indice]
    
     tabla[i+1,j+1] <- ( dim( ( X_new  %>% filter(V2_new==i) ) )[1] / dim(X_new)[1] )

  }
}
 rownames(tabla)<-0:p2
 colnames(tabla)<-0:p1
 
 print("V1 y V3 condicionan a V2, V3 toma valor fijo, V1 está en la parte superior (columnas) de la tabla y V2 en la inferior (filas)")
 
 tabla <- as.data.frame(tabla)
 
 return(tabla) 
}

```

```{r}
Tabla_Frecuencias_Relativas_Condicionadas_3_Variables(Datos ,V1=genero, V2_indice=9, p1=1, p2=1, V3=edad, valor_fijado_V3 =3 )
```


Por ejemplo, la proporción de personas con ingresos superiores  a la media (ingresos_categorizados_regla_media=1), dentro del grupo de los hombres (genero=0) mayores de 60 años (edad=3)  es 0.28


Comprobación:

```{r}
# Comprobamos cual es la variable V2 usada en el codigo anterior

names(Datos %>% select(9))
```

```{r}
# Calculamos manualmente la entrada (V1=0, V2=0, V3=3)

dim((Datos %>% filter(genero==0 & edad==3) )%>% filter(ingresos_categorizados_regla_media==0))[1] / dim((Datos %>% filter(genero==0 & edad==3) ))[1]
```
