# INSA Toulouse --- 3ICBE --- UF Microbiologie & Statistique 
## Contrôle de Statistique du 4/11/2016

*Aucun document n'est autorisé. 1 point par question.*

Le charbon actif est un matériau qui peut servir pour purifier de l’eau. Ses propriétés dépendent de la substance à partir de laquelle il est élaboré et des conditions expérimentales utilisées pour le préparer dont en particulier la température qui conditionne sa porosité.
Une équipe de chercheurs a mis au point un procédé nouveau d’obtention de charbon actif à partir d’un substrat fait de pulpe et de noyaux d’olive, résidus de l’extraction de l’huile.
Deux des caractéristiques prises en compte, dans l’optimisation du procédé de production de charbon actif, ont été 

- le rendement *Y1* du procédé, c’est-à-dire le pourcentage de charbon actif issu du substrat,  
- la capacité *Y2* d’adsorption du bleu de méthylène (en mg/g de charbon) de la préparation obtenue qui en mesure l’efficacité.
Un des paramètres importants du procédé est la température *T* à laquelle est soumis le substrat pour la production de charbon actif.


## 1 Comparaison des 2 méthodes de calcul
La capacité d’adsorption *Y2* peut être calculée de deux façons différentes: la méthode A (`MetA`) et la méthode B (`MetB`). Les résultats des deux calculs pour les mêmes morceaux de charbon actif figurent ci-dessous. On veut savoir si les deux méthodes de calcul donnent des résultats équivalents. 


In [None]:
MetA=c(135, 380, 246, 350, 461, 538, 699, 402, 456, 533)
MetB=c(152, 396, 270, 413, 455, 546, 743, 481, 434, 561)

Quatre tests sont considérés ci-dessous. Quelles sont leurs conditions d'utilisation ? Lesquels deux tests sont adaptés?

In [None]:
t.test(MetA, MetB)
t.test(MetA, MetB,paired=TRUE)
wilcox.test(MetA, MetB)
wilcox.test(MetA, MetB,paired=TRUE)

Quels sont les tests ci-dessous? Quelle hypothèse H0? Quelles résultat?

In [None]:
shapiro.test(MetA)
shapiro.test(MetB)

4- Quel test faut-il finalement utilisé à la question x? Quelle est l'hypothèse H0? Quelle est la conclusion?

## 2 Effet de la température sur le rendement et l'efficacité
Par la suite, une des deux méthodes a été choisie pour des raisons économiques.
### 2.1 Description
Les observations on été faites dans le cadre d'une expérimentation planifiée conduisant aux mesures ci-dessous. Pour chaque *niveau* de température *T*: 750, 775, 800, 825, 850, les variables *Y1* et *Y2* ont été observées lors de 4 expériences indépendante.

In [None]:
T=c(750,750,750,750,775,775,775,775,800,800,800,800,825,825,825,825,850,850,850,850)
Y1=c(19.1,20.6,16.9,20.1,16.9,19.5,18.4,15.8,15.7,10.2,13.7,13.4,10.2,9.4,6.8,10.7,8.1,5.3,4.8,3.4)
Y2=c(118,101,95,98,244,214,238,258,341,426,435,388,408,578,503,549,572,692,662,803)
data=data.frame(T,Y1,Y2)
summary(data)

Que dire des distributions de *Y1* et *Y2* ?

In [None]:
options(repr.plot.width=8, repr.plot.height=4)
opar=par(mfrow=c(1,2))
boxplot(Y1);boxplot(Y2)

In [None]:
shapiro.test(Y1); shapiro.test(Y2)

5- Que dire des relations entre la température et chacune des variables Y1 et Y2 ?

In [None]:
cor(T,Y1)
cor(T,Y2)
opar=par(mfrow=c(1,2))
plot(T,Y1)
plot(T,Y2)

### 2.2 Rendement *Y1* fonction de la température *T*

In [None]:
reg1=lm(Y1~T)
res.student=rstudent(reg1)
ychap=reg1$fitted.values
opar=par(mfrow=c(1,2))
qqnorm(reg1$residuals)
qqline(reg1$residuals)
plot(res.student~ychap,ylab="Residus")

In [None]:
shapiro.test(reg1$residuals)
summary(reg1)

### Efficacité *Y2* en fonction de la température *T*

In [None]:
reg2=lm(Y2~T)
res.student=rstudent(reg2)
ychap=reg2$fitted.values
opar=par(mfrow=c(1,2))
qqnorm(reg2$residuals)
qqline(reg2$residuals)
plot(res.student~ychap,ylab="Residus")

In [None]:
shapiro.test(reg2$residuals)
summary(reg2)

6. Que pensez de la qualité de la régression de Y1 sur T ?

7. Que valent le quantile 0,975 de la loi de Student à 18 degrés de liberté et l’écart-type de l’estimation de b1 ? 

8. Calculer une estimation par intervalle de confiance du paramètre b1 de cette régression.

9. Comment conclure sur l’influence de T sur Y1 (test, hypothèse, décision) ? 

10. Que pensez de la première régression calculée de Y2 sur T ?

### 2.3 Autre approche de létude de l'efficacité *Y2*

On se propose de résoudre le problème par une transformation adaptée des données ou encore, c'est équivalent, par une pondération des observations : les observations associées à des valeurs de plus grande variance sont pénalisées. Cette approche est possible car l’expérience est **planifiée** : elle est répétée 4 fois pour chaque *niveau* de température 750, 775, 800, 825, 850. Il est donc possible de calculer la variance des observations de *Y2* pour chacun des niveaux de *T*. 

11. Calculer, pour chaque niveau de température, la variance des valeurs observées de Y2. Comparer les variances obtenues.

In [None]:
v1=aggregate(Y2~T,FUN=var)

12. Les inverses de ces valeurs sont rangées dans une variable `poids`. Comment ces valeurs sont-elles utilisées pour estimer les paramètres de régression ?

In [None]:
v_1=1/v1
poids=as.vector(c(1,1,1,1)%o%v_1$Y2 )
poids

13. Que pensez vous de la qualité (validité, qualité d’estimation) de la régression alors obtenue ?

In [None]:
reg3=lm(Y2~T,weights=poids)
res.student=rstudent(reg3)
ychap=reg3$fitted.values
opar=par(mfrow=c(1,2))
qqnorm(reg3$residuals)
qqline(reg3$residuals)
plot(res.student~ychap,ylab="Residus")

In [None]:
shapiro.test(reg2$residuals)
summary(reg2)

In [None]:
predict(reg1, interval="confidence")[c(1:3,18:20),]

In [None]:
predict(reg2, interval="prediction")[c(1:3,18:20),]

### Complément

In [None]:
opar=par(mfrow=c(1,2))
plot(T,Y1)
abline(reg1)
segments(T,fitted(reg1),T, Y1)
pred.frame<-data.frame(T=750:850)
pc<-predict(reg1, interval="confidence", newdata=pred.frame)
pp<-predict(reg1, interval="prediction", newdata=pred.frame)
matlines(pred.frame, pc[,2:3], lty=c(2,2), col="blue")
matlines(pred.frame, pp[,2:3], lty=c(3,3), col="red")
plot(T,Y2)
abline(reg3)
segments(T,fitted(reg3),T, Y2)
pred.frame<-data.frame(T=750:850)
pc<-predict(reg3, interval="confidence")
pp<-predict(reg3, interval="prediction")
matlines(T, pc[,2:3], lty=c(2,2), col="blue")
matlines(T, pp[,2:3], lty=c(3,3), col="red")

## 3 Comparaison des fournisseurs
Une fois les conditions optimales déterminées, de nombreuses préparations ont été réalisées selon ces mêmes conditions expérimentales à partir de substrats procurés par 3 fournisseurs : E, M et F. Les mesures obtenues sont résumées ci-dessous.

Quelles méthode mettre en œuvre permettant de comparer les rendements issus des substrats fournis par les différents fournisseurs. Quelle est l’hypothèse testée ?

Quelles sont les conditions à vérifier pour la mise en œuvre d’une telle méthode ? Sont elles vérifiées ? Explicitez les hypothèses, les décisions. 

16. Quelle méthode faudrait-il mettre en œuvre si ces conditions n’étaient pas vérifiées ?
17. Que dire de la comparaison des fournisseurs ?
18. Est-il raisonnable de regrouper les fournisseurs dans des études ultérieures ?
19. Une préparation supplémentaire est produite dans ces conditions. Dans quel intervalle son rendement aurait-il 95% de chances de se trouver ? Explicitez les calculs.
20. Avant la mise au point du nouveau procédé, le rendement moyen des préparations de charbon actif était de l’ordre de 11%. Peut-on considérer que le rendement moyen du nouveau procédé est meilleur ? Précisez votre raisonnement

In [None]:
RendE=c(7.6,11.1,18.5,12.7,7.9,11,9.1,8.1,13.6,21.2,9.5,15.1,14.5,13.5,13.8)
RendM=c(10.4,16.7,10.4,14.7,14.2,16.8,17.9,7.7,20.7,15,14.9,15.1,12.3,10.4,19.9)
RendF=c(10.1,13.1,1.8,11.9,8.2,5.8,5,9.8,8.1,21.5,21.5,14.7,9.6,5.9,21.6,5.4,14.8,11.5,15.8,16.1)
Four=factor(c(rep(1,length(RendE)),rep(2,length(RendM)),rep(3,length(RendF))),labels=c("E","M","F"))
RendFour=data.frame("Rend"=c(RendE,RendM,RendF),Four)
summary(RendFour)
aggregate(Rend~Four,FUN=mean,data=RendFour)

In [None]:
boxplot(Rend~Four,data=RendFour)

In [None]:
bartlett.test(Rend~Four,data=RendFour)

In [None]:
reg4=aov(Rend~Four,data=RendFour)
qqnorm(reg4$residuals)
qqline(reg4$residuals)
shapiro.test(reg4$residuals)

In [None]:
summary(reg4)

In [None]:
kruskal.test(Rend~Four,data=RendFour)

In [None]:
t.test(RendFour$Rend)
t.test(RendM)