# Equivalencia de las tablas Burt y Disyuntiva
___
**Autores:** Wilmar Sepulveda - Luis Esteban Garcia

**Institución:** Escuela de estadística - Universidad del Valle
___




In [4]:
#install.packages("ade4")
library(ade4)
perros_0<-read.csv('perros.txt',sep="\t",row.names = 1,stringsAsFactors = T)
perros_0 # Tabla de datos R
dim(perros_0)

"package 'ade4' was built under R version 3.6.3"

Unnamed: 0,TAM,PESO,VEL,INT,AFC,AGR,FUN
bass,p,p,p,p,p,m,Caza
beau,g,m,g,m,m,m,Util
boxe,m,m,m,m,m,m,Comp
buld,p,p,p,m,m,p,Comp
bulm,g,g,p,g,p,m,Util
cani,p,p,m,g,m,p,Comp
chih,p,p,p,p,m,p,Comp
cock,m,p,p,m,m,m,Comp
coll,g,m,g,m,m,p,Comp
dalm,m,m,m,m,m,p,Comp


El análisis de correspondencias múltiples es un análisis de correspondencias simples aplicado no a una tabla de contingencia sino a una tabla *disyuntiva completa* o una tabla de Burt.

## Tabla disyuntiva completa

Se construye, a partir de la tabla **R**, la tabla **Z** con *n* filas y p columnas describiendo las s respuestas de los *n* individuos mediante un código binario. En termino general se escribe: 
$$z_{ij} = 1$ o $z_{ij}=0$$

según si el sujeto *i* seleccionó la modalidad *j* de la pregunta *q* o no.


In [5]:
n <- nrow(perros_0) 
perros <- list(tab=perros_0[,1:6],funcion=perros_0[,7])
s <- ncol(perros$tab)

Z <- acm.disjonctif(perros$tab); Z	# Z

Unnamed: 0,TAM.g,TAM.m,TAM.p,PESO.g,PESO.m,PESO.p,VEL.g,VEL.m,VEL.p,INT.g,INT.m,INT.p,AFC.m,AFC.p,AGR.m,AGR.p
bass,0,0,1,0,0,1,0,0,1,0,0,1,0,1,1,0
beau,1,0,0,0,1,0,1,0,0,0,1,0,1,0,1,0
boxe,0,1,0,0,1,0,0,1,0,0,1,0,1,0,1,0
buld,0,0,1,0,0,1,0,0,1,0,1,0,1,0,0,1
bulm,1,0,0,1,0,0,0,0,1,1,0,0,0,1,1,0
cani,0,0,1,0,0,1,0,1,0,1,0,0,1,0,0,1
chih,0,0,1,0,0,1,0,0,1,0,0,1,1,0,0,1
cock,0,1,0,0,0,1,0,0,1,0,1,0,1,0,1,0
coll,1,0,0,0,1,0,1,0,0,0,1,0,1,0,0,1
dalm,0,1,0,0,1,0,0,1,0,0,1,0,1,0,0,1


## Tabla de contingencia de Burt

Se construye, a partir de la tabla disyuntiva completa **Z**, la tabla simétrica **B** de orden *(p,p)* que ensambla los cruzamientos dos a dos de todas las variables:

<center> $B=Z'Z$ </center>

**B** se llama tabla de contingencia de Burt asociada a la tabla disyuntiva completa **Z**.

El termino general de **B** se escribe:

 $$b_{ij}=\sum_{i=1}^{n}z_{ij}z_{ij'}$$ 


In [6]:
p <- ncol(Z)

B <- acm.burt(perros$tab,perros$tab); B

Unnamed: 0,TAM.g,TAM.m,TAM.p,PESO.g,PESO.m,PESO.p,VEL.g,VEL.m,VEL.p,INT.g,INT.m,INT.p,AFC.m,AFC.p,AGR.m,AGR.p
TAM.g,15,0,0,5,10,0,9,2,4,4,6,5,3,12,9,6
TAM.m,0,5,0,0,4,1,0,4,1,1,4,0,5,0,2,3
TAM.p,0,0,7,0,0,7,0,2,5,1,3,3,6,1,2,5
PESO.g,5,0,0,5,0,0,1,0,4,1,2,2,0,5,4,1
PESO.m,10,4,0,0,14,0,8,6,0,4,7,3,7,7,6,8
PESO.p,0,1,7,0,0,8,0,2,6,1,4,3,7,1,3,5
VEL.g,9,0,0,1,8,0,9,0,0,3,3,3,3,6,5,4
VEL.m,2,4,2,0,6,2,0,8,0,2,5,1,6,2,3,5
VEL.p,4,1,5,4,0,6,0,0,10,1,5,4,5,5,5,5
INT.g,4,1,1,1,4,1,3,2,1,6,0,0,3,3,3,3


# Equivalencia

La tabla B de Burt, obtenida de una tabla disyuntiva completa, es un conjunto particular de tablas de contingencia que son las caras del hipercubo de
contingencia.

El análisis de correspondencias aplicado a una tabla disyuntiva completa **Z** es equivalente al análisis de la tabla de Burt **B** y produce los mismos vectores propios.


## Equivalencia en valores propios

los valores propios asociados difieren, los obtenidos del análisis de *B*, notados $\lambda_{B}$, son el cuadrado de los obtenidos en el análisis de $Z$:

$$\lambda_{B}=\lambda^{2}$$

Ver capítulo de ACM de Lebart

In [7]:
acs.burt=dudi.coa(B,scannf=FALSE,nf=4)
acs.disc=dudi.coa(Z,scannf=FALSE,nf=4)

print("Valores propios Burt vs Disyuntiva")

vlps<-data.frame(acs.burt$eig, acs.disc$eig)
names(vlps)<-c("Vlps por Burt","Vlps por Disyuntiva")
vlps

[1] "Valores propios Burt vs Disyuntiva"


Vlps por Burt,Vlps por Disyuntiva
0.2319444978,0.481606165
0.1480227806,0.384737288
0.0445016109,0.210954049
0.0248232709,0.157554025
0.0225398186,0.15013267
0.015201733,0.123295308
0.0066361324,0.08146246
0.0020857267,0.045669757
0.0005542216,0.023541911
5.94909e-05,0.007713034


In [8]:
vlps<-data.frame(sqrt(acs.burt$eig),acs.disc$eig)
names(vlps)<-c("Vlps por Burt corregidos","Vlps por Disyuntiva")
vlps

Vlps por Burt corregidos,Vlps por Disyuntiva
0.481606165,0.481606165
0.384737288,0.384737288
0.210954049,0.210954049
0.157554025,0.157554025
0.15013267,0.15013267
0.123295308,0.123295308
0.08146246,0.08146246
0.045669757,0.045669757
0.023541911,0.023541911
0.007713034,0.007713034


## Equivalencia en coordenadas factoriales

Los factores $\varphi_{\alpha}$ obtenidos en el análisis de **Z**, representan las coordenadas factoriales de las modalidades, que tienen norma $\lambda$, mientras que el factor correspondiente al análisis de **B**, notado $\varphi_{B\alpha}$, tendrá por norma $\lambda^{2}$. finalmente

$$\varphi_{B\alpha}= \varphi_{\alpha}\sqrt{\lambda_{\alpha}}$$

De donde se obtiene la relación que liga a los dos sistemas de coordenadas factoriales:

In [9]:
coords<-data.frame(acs.burt$co,acs.disc$co) # coordenadas factoriales
names(coords)<-c("Dim1 Burt","Dim2 Burt","Dim3 Burt","Dim4 Burt","Dim1 Disc","Dim2 Disc","Dim3 Disc","Dim4 Disc")
coords

Unnamed: 0,Dim1 Burt,Dim2 Burt,Dim3 Burt,Dim4 Burt,Dim1 Disc,Dim2 Disc,Dim3 Disc,Dim4 Disc
TAM.g,0.5806347,0.01276424,0.02352403,-0.067566253,0.8366753,-0.02057846,-0.05121744,-0.17022176
TAM.m,-0.5906368,0.76400119,-0.46666988,0.135931458,-0.851088,-1.23171972,1.01605178,0.34245635
TAM.p,-0.8223338,-0.57306708,0.28292699,0.047690929,-1.1849557,0.9238965,-0.61599962,0.12014924
PESO.g,0.7044813,-0.60408323,-0.56107512,0.02683448,1.0151341,0.97390062,1.22159452,0.06760494
PESO.m,0.2119447,0.50792564,0.10622265,-0.046982292,0.3054053,-0.81887572,-0.23127208,-0.11836395
PESO.p,-0.811204,-0.51131784,0.16478231,0.065447461,-1.168918,0.82434462,-0.35877044,0.16488382
VEL.g,0.6190981,0.23063725,0.35048407,-0.09520314,0.8920999,-0.37183247,-0.76308752,-0.23984823
VEL.m,-0.4189456,0.55068584,-0.16365338,0.146960987,-0.6036867,-0.88781355,0.35631249,0.37024339
VEL.p,-0.2220319,-0.64812219,-0.18451296,-0.031885963,-0.3199406,1.04490006,0.40172878,-0.0803313
INT.g,0.2325283,0.28500442,0.2755434,0.506185405,0.3350656,-0.45948302,-0.59992378,1.27524863


Claramente se observa que las coordenadas para las variables generadas por la tabla de Burt y por la tabla disjuntiva completa son diferentes, sin embargo debido a las equivalencias se puede pasar de un resultado a otro de la siguiente manera, para la primera componente $$\varphi_{B,1}= \varphi_{1}\sqrt{\lambda_{1}}$$

In [3]:
print("Primera componente de Burt")
acs.burt$co[,1]
print("Primera componente dejuntiva transformada a burt")
acs.disc$co[,1]*sqrt(acs.disc$eig[1])

[1] "Primera componente de Burt"


[1] "Primera componente dejuntiva transformada a burt"


De manera analoga se pueden obtener las coordenadas para los demas componentes

## Equivalencia en vectores propios

Tambien observamos que los vectores propios asociados a las columnas en ambas tablas son iguales

In [7]:
coords<-data.frame(acs.burt$c1,acs.disc$c1) # Coordenadas factoriales normadas
names(coords)<-c("Dim1 Burt","Dim2 Burt","Dim3 Burt","Dim4 Burt","Dim1 Disc","Dim2 Disc","Dim3 Disc","Dim4 Disc")
coords

Unnamed: 0,Dim1 Burt,Dim2 Burt,Dim3 Burt,Dim4 Burt,Dim1 Disc,Dim2 Disc,Dim3 Disc,Dim4 Disc
TAM.g,1.2056214,0.03317651,0.1115126,-0.42884498,1.2056214,-0.03317651,-0.1115126,-0.42884498
TAM.m,-1.2263896,1.9857737,-2.2121874,0.86276093,-1.2263896,-1.9857737,2.2121874,0.86276093
TAM.p,-1.7074819,-1.48950231,1.3411783,0.30269572,-1.7074819,1.48950231,-1.3411783,0.30269572
PESO.g,1.4627746,-1.57011876,-2.659703,0.17031923,1.4627746,1.57011876,2.659703,0.17031923
PESO.m,0.4400788,1.32018822,0.5035345,-0.29819798,0.4400788,-1.32018822,-0.5035345,-0.29819798
PESO.p,-1.6843721,-1.32900516,0.7811289,0.41539695,-1.6843721,1.32900516,-0.7811289,0.41539695
VEL.g,1.2854863,0.59946685,1.6614238,-0.60425711,1.2854863,-0.59946685,-1.6614238,-0.60425711
VEL.m,-0.8698925,1.43132952,-0.7757774,0.93276568,-0.8698925,-1.43132952,0.7757774,0.93276568
VEL.p,-0.4610237,-1.68458378,-0.8746595,-0.20238114,-0.4610237,1.68458378,0.8746595,-0.20238114
INT.g,0.4828184,0.74077672,1.3061773,3.21277355,0.4828184,-0.74077672,-1.3061773,3.21277355


Note que en la tabla de burt no existen indivudios, por tanto no tiene sentido hablar de equivalencias entre coordenadas de individuos, unicamente remintimos el análisis a variables