Marcelo 30/11/2016

# Modelos Log Lineares para análise de tabelas de contingência
## Exemplo: experimento do Vitor
No experimento, o Vitor tirava formigas de uma trilha e colova na trilha da sub colonia irma e contou quantas formigas iam para um lado ou outro da trilha (escolha) nas seguintes condições:
* quando ela transportava ou não (transporte)
* quando havia iluminação ou não (iluminação)
* quando as colônias estavam orientadas para o mesmo lado ou opostos (orientação)

A ideia era ver quais desses fatores faziam com que as formigas fossem preferencialmente em direção à colônia ou às folhas, uma vez que se forem meio à meio elas não estariam utilizando nenhuma desses fatores para decidir para qual sentido ir após o deslocamento


## 1.Dados

In [7]:
observado  = c(41, 59, 75, 25, 28, 72, 69, 31, 68, 32, 18, 82, 63, 37, 31, 69)
orientacao = c( 0,  0,  0,  0,  0,  0,  0,  0,  1,  1,  1,  1,  1,  1,  1,  1)
iluminacao = c( 0,  0,  0,  0,  1,  1,  1,  1,  0,  0,  0,  0,  1,  1,  1,  1)
transporte = c( 0,  0,  1,  1,  0,  0,  1,  1,  0,  0,  1,  1,  0,  0,  1,  1)
escolha  = c( 0,  1,  0,  1,  0,  1,  0,  1,  0,  1,  0,  1,  0,  1,  0,  1)
exp_data = data.frame(observado, orientacao, iluminacao, transporte, escolha)
exp_data

observado,orientacao,iluminacao,transporte,escolha
41,0,0,0,0
59,0,0,0,1
75,0,0,1,0
25,0,0,1,1
28,0,1,0,0
72,0,1,0,1
69,0,1,1,0
31,0,1,1,1
68,1,0,0,0
32,1,0,0,1


Por exemplo, na situação em que as colônias tinham a mesma orientação (orientação = 0), na ausência de luz (iluminação = 0), e não tranportavam (transporte = 0), 41 formigas foram para um lado, e 59 foram para outro

## 2. Análise

Análise segue a descrição do Zar [1] (pág 505) de análise de tabelas de contigência de 3 dimensões. No entanto, neste caso temos quatro dimensões. Uma das possibilidades seria fazer como o Zar, utilisando análises de qui-quadradro. Outra possibilidade é usar as análises segundo modelos log-lineares, é exatamente a mesma coisa, e a interpretação é idêntica à do livro.
As fórmulas para testar modelos de independência mútua utilizadas foram obtidas em [2]

In [8]:
library(MASS)    # importa um pacote
library(gmodels) # importa outro pacote

# monta tabelas cruzadas (sub tabelas de contingência) a partir dos dados acima
mytable <- xtabs(observado ~ orientacao + iluminacao + transporte + escolha)

### 2.1 Testar independência mútua entre todas as váriaveis independentes (preditoras, fatores)

In [10]:
loglm(~orientacao + iluminacao + transporte + escolha, mytable)

Call:
loglm(formula = ~orientacao + iluminacao + transporte + escolha, 
    data = mytable)

Statistics:
                      X^2 df P(> X^2)
Likelihood Ratio 143.2771 11        0
Pearson          136.9569 11        0

rejeita-se H0 de que os fatores sejam mutuamente independentes, portanto pode-se testar as independencias mútuas parciais


### 2.2 Independências mútuas parciais

#### 2.2.1 Testar se **orientacao** é parcialmente independente do resto

In [12]:
loglm(~orientacao + iluminacao + transporte + escolha + iluminacao*transporte*escolha, mytable)

Call:
loglm(formula = ~orientacao + iluminacao + transporte + escolha + 
    iluminacao * transporte * escolha, data = mytable)

Statistics:
                      X^2 df P(> X^2)
Likelihood Ratio 139.2969  7        0
Pearson          133.5791  7        0

#### 2.2.2 Testar se **iluminacao** é parcialmente independente do resto

In [16]:
loglm(~orientacao + iluminacao + transporte + escolha + orientacao*transporte*escolha, mytable)

Call:
loglm(formula = ~orientacao + iluminacao + transporte + escolha + 
    orientacao * transporte * escolha, data = mytable)

Statistics:
                      X^2 df  P(> X^2)
Likelihood Ratio 9.815082  7 0.1992971
Pearson          9.753552  7 0.2029749

#### 2.2.3 Testar se transporte é parcialmente independente do resto

In [19]:
loglm(~orientacao + iluminacao + transporte + escolha + orientacao*iluminacao*escolha, mytable)

Call:
loglm(formula = ~orientacao + iluminacao + transporte + escolha + 
    orientacao * iluminacao * escolha, data = mytable)

Statistics:
                      X^2 df P(> X^2)
Likelihood Ratio 133.5467  7        0
Pearson          128.9313  7        0

#### 2.2.4 Testar se escolha é parcialmente independente do resto

In [20]:
loglm(~orientacao + iluminacao + transporte + escolha + orientacao*iluminacao*transporte, mytable)

Call:
loglm(formula = ~orientacao + iluminacao + transporte + escolha + 
    orientacao * iluminacao * transporte, data = mytable)

Statistics:
                      X^2 df P(> X^2)
Likelihood Ratio 143.2771  7        0
Pearson          136.9569  7        0

## 3. Referências

[1] Zar, Jerrold H. "Biostatistical analysis. 4th." New Jersey, USA (1999): 929.
APA. Pag 505.

[2] http://www.statmethods.net/stats/frequencies.html - LogLinear Models - Mutual Independence