In [1]:
#' MANOVA_class
#'
#' @param dfw a dataframe 
#'
#' @return ret a list constitute by :
#'         test_result a dataframe
#'         variance a dataframe
#'         class_mean a dataframe
#'
#' @examples 
#'
#'       x1  x2  x3     fac
#'    1  35  3.5 2.80   1
#'    2  35  4.9 2.70   1
#'    3  40  3.0 4.38   1
#'    4  10  2.8 3.21   1
#'    5   6  2.7 2.73   1
#'    6  20  2.8 2.81   2
#'    7  35  4.6 2.88   2
#'    8  35 10.9 2.90   2
#'    9  35  8.0 3.28   2
#'    10 30  1.6 3.20   2
#'
#'    $test
#'    T².Hotteling   Fobs        p.value
#'    1.995481       0.4988702   0.4097309
#'
#'    $variance
#'       x1        x2      x3
#'    x1 147.60000 11.7400 2.455750
#'    x2 11.74000  7.7445  -0.118400 
#'    x3 2.45575   -0.1184 0.274355
#'
#'    $class_mean
#'       x1   x2   x3
#'    G1 25.2 3.38 3.164
#'    G2 31.0 5.58 3.014
#'
#' MANOVA_class(df) 

MANOVA_class <- function(dfw)
  {
    #-> détection automatique des variables numériques
   id_num <- which(sapply(dfw, is.numeric))
   X <- dfw[,id_num]

   #-> .. on cherche la variable NON numérique ..
   id_string  <- which(!sapply(dfw, is.numeric))

   #-> pour faciliter et uniformiser les recherches des classes, on renomme cette variable
   names(dfw)[id_string] <- 'fac' 

   # ici code à compléter en utilisant ce qui a été développé dans la première partie
   #  création de la liste
  
    p = ncol(X)
    l = nrow(X)
    
    df_g1 <- X[1:(l/2), 1:p]

    df_g2 <- X[(l/2+1):l, 1:p]
    
  
   # calcul de la variance commune
    
    G1 <- list(data = df_g1,n = nrow(df_g1), mean = colMeans(df_g1), S2 = cov(df_g1))
    
    G2 <- list(data = df_g2,n = nrow(df_g2), mean = colMeans(df_g2), S2 = cov(df_g2))

    Sd2 <- ((G1$n - 1) * (G1$S2) + (G2$n -1 )*(G2$S2)) / (G1$n + G2$n - 2)
    
    L <- list(G1=G1, G2=G2)
 
   # matrice des différences des moyennes
    
    Y1Y2 <- G1$mean - G2$mean
 
   # calcul du T2 de Hotteling

    T2 <- t(Y1Y2) %*% solve(((1/G1$n)+(1/G2$n))*Sd2) %*% Y1Y2
    
    Fobs <- (G1$n + G2$n - p - 1) / (G1$n + G2$n - 2) / p * T2
 
   # calcul de la p value
    
    pvalue <- df(Fobs, 1, G1$n + G2$n - p - 1)
 
   # les résultats sont stockés dans une liste
 
 test_result        <- data.frame('T² Hotteling' = T2, 'Fobs' = Fobs, 'p value' = pvalue )
 variance           <- data.frame(Sd2) 
 colnames(variance) <- names(df)[id_num] ; rownames(variance) <- names(df)[id_num]
 class_mean         <- data.frame(t(sapply(L, function(x){return(x$mean)})))
 
 ret   <- list(test = test_result, variance = variance, class_mean = class_mean)
 
 return(ret)
 
 }

In [2]:
x1  <- c(35,35,40,10,6,20,35,35,35,30)
x2  <- c(3.5,4.9,3,2.8,2.7,2.8,4.6,10.9,8,1.6)
x3  <- c(2.8,2.7,4.38,3.21,2.73,2.81,2.88,2.9,3.28,3.2)
fac <-c(1,1,1,1,1,2,2,2,2,2)
df  <- data.frame(x1,x2,x3,fac)

#---1. Transformation de la variable fac en facteur
#-> variable factorielle
df$fac <- as.factor(df$fac) 

#-> nb de facteur (= 2)
k <- nlevels(df$fac)

#-> nb de variables
n_var <- ncol(df) - 1

#-> Nombre d'observations 
N <- nrow(df)

print(df)

   x1   x2   x3 fac
1  35  3.5 2.80   1
2  35  4.9 2.70   1
3  40  3.0 4.38   1
4  10  2.8 3.21   1
5   6  2.7 2.73   1
6  20  2.8 2.81   2
7  35  4.6 2.88   2
8  35 10.9 2.90   2
9  35  8.0 3.28   2
10 30  1.6 3.20   2


In [3]:
MANOVA_class(df)

T².Hotteling,Fobs,p.value
1.995481,0.4988702,0.4097309

Unnamed: 0,x1,x2,x3
x1,147.6,11.74,2.45575
x2,11.74,7.7445,-0.1184
x3,2.45575,-0.1184,0.274355

Unnamed: 0,x1,x2,x3
G1,25.2,3.38,3.164
G2,31.0,5.58,3.014
