# OBJECTIF : 

Ce script permet de récupérer les données du fichier piège (nombres larves piégées, d'inflorescences au dessus des pièges, d'inflorescences vivantes et mortes à l'échelle de l'arbre du 18/07 au 06/10) et de les disposer dans des fichiers en fonction du bloc et de la modalité du sol. Pour chaque combinaison, a mis ces données soit au jour, soit pour deux dates par semaine.

## Importation des librairies

In [8]:
library(tidyverse)
library(readxl)
#library(plyr)
#library(dplyr)
#library(readr)
#library(xlsxjars)
#library(xlsx)
library(float)

## On se place dans le fichier piege 

In [9]:
#setwd("../Fichiers de donnees/Donnees brutes")
setwd("/home/bastien/Stage/Moi")

# Lecture du fichier piege 
#data0 = read.xlsx2("./piege0.xlsx", 3)
data0 <- as.data.frame(read_excel("/home/bastien/Stage/Moi/piege0.xlsx", sheet = 3))

# On enlève l'arbre 19 du bloc2 de la couverte sol nu car cet arbre a commencé à être suivi seulement en septembre
data0 = data0[-which(data0$bloc==2 & data0$trait=='enh.ras' & data0$arbre==19,),]
data0 <- data0[-which(data0$bloc==2 & data0$trait=='enh.ras' & data0$arbre==36,),]

## Fonction de récupération de données

In [10]:
# La fonction suivante renvoie un dataframe pour chaque date de relevé contenant 
# le nombre de larves piégées, le nombre d'inflos vivantes et mortes à l'échelle de l'arbre

donnees_piege = function (Bloc, Trait, Modalité, nbArbreTot) {
    
    # Arguments en entrée :
        ## Bloc : Un entier 1 ou 2 pour désigner le bloc choisi
        ## Trait : Un entier 0 ou 1
        ##         0 si on veut désigner la parcelle en entier
        ##         1 si on désigne une sous-parcelle/modalité
        ## Modalité : Si Trait vaut1, Modalité est une chaine de caractère "bache", "enh_haut" ou "enh_ras"
        ## nbArbreTot : Nombre d'arbres dans la (sous) parcelle concernée
    
    # On récupère les données, en fonction du bloc et de la modalité
    if (Trait==0)
        B = subset(data0[data0$bloc==Bloc,], 
           select=c(bloc, trait, arbre, piege, date, nb.larves, nb.inflo.piege, nb.inflo, nb.inflo.morte, nb.jours))
    else 
        B = subset(data0[data0$bloc==Bloc & data0$trait==Modalité,], 
           select=c(bloc, trait, arbre, piege, date, nb.larves, nb.inflo.piege, nb.inflo, nb.inflo.morte, nb.jours))
    
    # On rentre les dates de relevés
    date = c('18/07/2017','25/07/2017',
             '01/08/2017','08/08/2017','16/08/2017','18/08/2017','23/08/2017','25/08/2017','29/08/2017',
             '01/09/2017','06/09/2017','08/09/2017','13/09/2017','15/09/2017','20/09/2017','22/09/2017','26/09/2017','29/09/2017',
             '03/10/2017','06/10/2017')
    
    date_bis = unique(B$date)
    
    # On rentre le nombre de jours entre chaque relevé
    nb_jours = c(0,7,7,7,8,2,5,2,4,3,5,2,5,2,5,2,4,3,4,3)
    
    # Initialisation
    larves = array(0, length(date))
    inflos_vivantes = array(0, length(date))
    inflos_mortes = array(0, length(date))
    
    # On parcourt les données pour chaque date de relevé
    for (i in 1:length(date)) {

        # On récupère les données pour la date i
        tmp = B[B$date==date_bis[i],]
        
        # On enlève les lignes avec des NA pour le nombre de larves, les inflos vivantes ou mortes
        tmp = tmp[which(tmp$nb.larves!='NA'),]
        tmp = tmp[which(tmp$nb.inflo!='NA'),]
        tmp = tmp[which(tmp$nb.inflo.piege!='NA'),] ## VÉRIFIER COMBIEN D'INDIVIDUS ÉLIMINÉS
        
        # On change le type des facteurs pour pouvoir faire des opérations
        tmp$nb.larves = as.numeric(as.character(tmp$nb.larves))
        tmp$nb.inflo = as.numeric(as.character(tmp$nb.inflo))
        tmp$nb.inflo.piege = as.numeric(as.character(tmp$nb.inflo.piege))

        # j permet de parcourir, pour une date donnée, tous les pièges avec des relevés
        j = 1
        # AB vaut 0 tant qu'on n'est pas passé dans la boucle avec deux pièges, c'est à dire avant qu'ils posent le piège B
        # AB vaut 1 si on passe dans la boucle avec deux pièges, c'est à dire après le 16/08
        AB = 0
        # nbArbrePiege est un compteur pour connaître le nombre d'arbres ayant des pièges dessous
        nbArbrePiege = 0
        
        # Tant qu'on n'a pas parcouru toutes les dates de relevé
        while (j<dim(tmp)[1]) { ## OK NOMBRE INDIVIDUS DANS tmp ???<=??? 
            
            # Si l'arbre possède deux pièges A et B, on calcule le nombre de larves piégées à l'échelle de l'arbre piégé
            # et on récupère le nombre d'inflos vivantes dans l'arbre piégé
            if (tmp[j,]$trait==tmp[j+1,]$trait & tmp[j,]$arbre==tmp[j+1,]$arbre) {  ## PIÈGES A ET B
                if (tmp$nb.inflo.piege[j]+tmp$nb.inflo.piege[j+1]!=0) { ## S'IL N'Y A PAS D'INFLOS AU-DESSUS ARBRES PAS DE LARVES DANS PIÈGE
                    larves[i] = larves[i] + (tmp$nb.larves[j]+tmp$nb.larves[j+1])*tmp$nb.inflo[j]/(tmp$nb.inflo.piege[j]+tmp$nb.inflo.piege[j+1])
                }
                inflos_vivantes[i] = inflos_vivantes[i] + tmp$nb.inflo[j]
                j = j+2
                nbArbrePiege = nbArbrePiege + 1
                AB = 1
            }
            
            # Si l'arbre ne possède que le piège A, on calcule le nombre de larves piégées à l'échelle de l'arbre piégé
            # et on récupère le nombre d'inflos vivantes dans l'arbre piégé
            else {
                if (tmp$nb.inflo.piege[j]!=0) {
                    larves[i] = larves[i] + tmp$nb.larves[j]*tmp$nb.inflo[j]/tmp$nb.inflo.piege[j]
                }
                inflos_vivantes[i] = inflos_vivantes[i] + tmp$nb.inflo[j]
                j = j+1
                nbArbrePiege = nbArbrePiege + 1
            }
            
        }
        
        if (AB==0)
            nbArbrePiege = nbArbrePiege + 1 ## ????
        
        # On met le nombre de larves piégées et le nombre d'inflorescences des arbres piégées à l'échelle du verger
        coefArbre = nbArbreTot/nbArbrePiege
        inflos_vivantes[i] = inflos_vivantes[i] * coefArbre
        larves[i] = larves[i] * coefArbre
    }
    
    # On parcourt les données pour chaque date de relevé
    for (i in 1:length(date)) {
        
         # On récupère les données pour la date i
        tmp = B[B$date==date_bis[i],]
        
        # On enlève les lignes avec des NA pour le nombre d'inflos mortes
        tmp = tmp[which(tmp$nb.inflo.morte!='NA'),]
        
        # On change le type des facteurs pour pouvoir faire des opérations
        tmp$nb.inflo.morte = as.numeric(as.character(tmp$nb.inflo.morte))
        
        # j permet de parcourir, pour une date donnée, tous les pièges avec des relevés.
        j = 1
        # AB vaut 0 tant qu'on n'est pas passé dans la boucle avec deux pièges, c'est à dire avant qu'ils posent le piège B
        # AB vaut 1 si on passe dans la boucle avec deux pièges, c'est à dire après le 16/08
        AB = 0
        # nbArbrePiege est un compteur pour connaître le nombre d'arbres ayant des pièges dessous
        nbArbrePiege = 0 
        
        # Tant qu'on n'a pas parcouru toutes les dates de relevé
        while (j<dim(tmp)[1]) {
            
            # Si l'arbre possède deux pièges A et B, on récupère le nombre d'inflos mortes de l'arbre piégé
            if (tmp[j,]$trait==tmp[j+1,]$trait & tmp[j,]$arbre==tmp[j+1,]$arbre) {
                inflos_mortes[i] = inflos_mortes[i] + tmp$nb.inflo.morte[j]
                j = j+2
                nbArbrePiege = nbArbrePiege + 1
                AB = 1
            }
            
            # Si l'arbre ne possède que le piège A, on récupère le nombre d'inflos mortes de l'arbre piégé
            else {
                inflos_mortes[i] = inflos_mortes[i] + tmp$nb.inflo.morte[j]
                j = j+1
                nbArbrePiege = nbArbrePiege + 1
            }
        }
        
        if (AB==0)
            nbArbrePiege = nbArbrePiege + 1
        
        # On met le nombre d'inflorescences mortes des arbres piégées à l'échelle du verger
        coefArbre = nbArbreTot/nbArbrePiege
        inflos_mortes[i] = inflos_mortes[i] * coefArbre
        
    }
    
    larves_inflos = larves/inflos_vivantes 
    
    larves = round(larves)
    inflos_vivantes = round(inflos_vivantes)
    inflos_mortes = round(inflos_mortes)
    
    # On met toutes les données récupérées dans un dataframe
    BB = data.frame(date, larves, inflos_vivantes, inflos_mortes, larves_inflos, nb_jours)
    
    return (BB)
}

## On récupère les données au jour

In [20]:
# La fonction suivante renvoie un dataframe et le met dans un fichier excel en estimant le nombre de larves piégées, 
# le nombre d'inflos vivantes et le nombre d'inflos mortes tous les jours

donnees_piege_jour = function (Bloc, Trait, Modalité, Nom, nbArbreTot) {
    
    
    # Arguments en entrée :
        ## Bloc : Un entier 1 ou 2 pour désigner le bloc choisi
        ## Trait : Un entier 0 ou 1. 0 si on veut désigner la parcelle en entier. 1 si on désigne une sous-parcelle/modalité
        ## Modalité : Si Trait vaut1, Modalité est une chaine de caractère "bache", "enh_haut" ou "enh_ras"
        ## nbArbreTot : Nombre d'arbres dans la (sous) parcelle concernée

    # On récupère les données du dataframe
    Parcelle = donnees_piege (Bloc, Trait, Modalité, nbArbreTot)
    date = Parcelle$date
    date = as.Date(date, '%d/%m/%Y')
    date_ = as.Date(strptime(date, format = "%Y-%m-%d"))
    diff = as.double(difftime(date_[length(date)],date[1], units = "days"))
    
    # Initialisation
    larves = array(0, diff)
    inflos_vivantes = array(0, diff)
    inflos_mortes = array(0, diff)
    
    date = date[1] + (0:diff)

    # On récupères les données pour chaque date de passage et on les transforme en données journalières
    inflos_vivantes[1] = Parcelle$inflos_vivantes[1]
    inflos_mortes[1] = Parcelle$inflos_mortes[1]
    
    nb_jours = c(7,7,7,7,8,2,5,2,4,3,5,2,5,2,5,2,4,3,4,3)
    larves[1] = Parcelle$larves[1]/nb_jours[1]

    #ii = 2
    #for (i in 2:length(nb_jours)) {
     #   larves[ii:(ii+nb_jours[i]-1)] = (Parcelle$larves[i]/nb_jours[i])*array(1,nb_jours[i])
      #  ii = ii + nb_jours[i]
    #}
    
    ii = 2
    for (i in 2:length(date)) {
        if (date[i] %in% date_) {
            inflos_vivantes[i] = Parcelle$inflos_vivantes[ii]
            inflos_mortes[i] = Parcelle$inflos_mortes[ii]
            larves[i] = Parcelle$larves[ii]
            ii = ii+1
        }
        else {
            before = as.integer(date[i]-date_[ii-1])
            after = as.integer(date_[ii] - date[i])
            inflos_vivantes[i] = round((Parcelle$inflos_vivantes[ii-1]*after + Parcelle$inflos_vivantes[ii]*before)/(before+after))
            inflos_mortes[i] = round((Parcelle$inflos_mortes[ii-1]*after + Parcelle$inflos_mortes[ii]*before)/(before+after))
            larves[i] = round((Parcelle$larves[ii-1]*after + Parcelle$larves[ii]*before)/(before+after))
        }
    }
    
    larves_inflos = larves/inflos_vivantes
    
    larves = round(larves)
    inflos_vivantes = round(inflos_vivantes)
    inflos_mortes = round(inflos_mortes)

    BB = data.frame(date, larves, inflos_vivantes, inflos_mortes, larves_inflos)

    #write.xlsx(BB, paste0("../Donnees re organisees/Fichier piege/",Nom,"_jour.xls"), sheetName="1")
    write.csv2(BB, paste0("Data/",Nom,"_jour.csv"))
    
    return (BB)
}

In [21]:
# Pour tous les jours 
Bloc1_donnees_piege_j = donnees_piege_jour (1, 0, "Modalité", "Bloc1", 153)
Bloc1_bache_donnees_piege_j = donnees_piege_jour (1, 1, "bache", "Bloc1_bache", 45)
Bloc1_enh_haut_donnees_piege_j = donnees_piege_jour (1, 1, "enh.haut", "Bloc1_enh_haut", 59)
Bloc1_enh_ras_donnees_piege_j = donnees_piege_jour (1, 1, "enh.ras", "Bloc1_enh_ras", 49)
Bloc2_donnees_piege_j = donnees_piege_jour (2, 0, "Modalité", "Bloc2", 150)
Bloc2_bache_donnees_piege_j = donnees_piege_jour (2, 1, "bache", "Bloc2_bache", 51)
Bloc2_enh_haut_donnees_piege_j = donnees_piege_jour (2, 1, "enh.haut", "Bloc2_enh_haut", 46)
Bloc2_enh_ras_donnees_piege_j = donnees_piege_jour (2, 1, "enh.ras", "Bloc2_enh_ras", 53)

## On récupère les données deux fois par semaine

In [22]:
# La fonction suivante renvoie un dataframe et le met dans un fichier excel en estimant le nombre de larves piégées, 
# le nombre d'inflos vivantes et le nombre d'inflos mortes pour deux dates par semaine (le mardi et le vendredi)

donnees_piege_semaine = function (Parcelle_jour, Nom) {
    
    # Dates qu'on impose, deux fois par semaine, le mardi et le vendredi
    date_ = c('18/07/2017','21/07/2017','25/07/2017','28/07/2017',
             '01/08/2017','04/08/2017','08/08/2017','11/08/2017', '15/08/2017','18/08/2017','22/08/2017','25/08/2017','29/08/2017',
             '01/09/2017','05/09/2017','08/09/2017','12/09/2017','15/09/2017','19/09/2017','22/09/2017','26/09/2017','29/09/2017',
             '03/10/2017','06/10/2017')
    date_ = as.Date(date_, '%d/%m/%Y')
    date_ = as.Date(strptime(date_, format = "%Y-%m-%d"))
    
    larves_jour = Parcelle_jour$larves
    inflos_vivantes_jour = Parcelle_jour$inflos_vivantes
    inflos_mortes_jour = Parcelle_jour$inflos_mortes
    date = Parcelle_jour$date
    
    # Initialisation
    larves = array(0, length(date_))
    inflos_vivantes = array(0, length(date_))
    inflos_mortes = array(0, length(date_))
    
    D = 1
    for (i in 1:length(date_)) {
        C = which(date_[i]==date)
        inflos_vivantes[i] = inflos_vivantes_jour[C]
        inflos_mortes[i] = inflos_mortes_jour[C]
        larves[i] = sum(larves_jour[D:(C-1)])
        D = C
    }
    
    larves_inflos = larves/inflos_vivantes
    
    date = date_
    
    larves = round(larves)
    inflos_vivantes = round(inflos_vivantes)
    inflos_mortes = round(inflos_mortes)
    
    BB = data.frame(date, larves, inflos_vivantes, inflos_mortes, larves_inflos)
    
    #write.xlsx(BB, paste0("../Donnees re organisees/Fichier piege/",Nom,"_semaine.xls"), sheetName="1")
    write.csv2(BB, paste0("Data/",Nom, "_semaine.csv"))
    
    return (BB)
}

In [23]:
# Pour deux dates par semaine 
Bloc1_donnees_piege_s = donnees_piege_semaine (Bloc1_donnees_piege_j, "Bloc1")
Bloc1_bache_donnees_piege_s = donnees_piege_semaine (Bloc1_bache_donnees_piege_j, "Bloc1_bache")
Bloc1_enh_haut_donnees_piege_s = donnees_piege_semaine (Bloc1_enh_haut_donnees_piege_j, "Bloc1_enh_haut")
Bloc1_enh_ras_donnees_piege_s = donnees_piege_semaine (Bloc1_enh_ras_donnees_piege_j, "Bloc1_enh_ras")
Bloc2_donnees_piege_s = donnees_piege_semaine (Bloc2_donnees_piege_j, "Bloc2")
Bloc2_bache_donnees_piege_s = donnees_piege_semaine (Bloc2_bache_donnees_piege_j, "Bloc2_bache")
Bloc2_enh_haut_donnees_piege_s = donnees_piege_semaine (Bloc2_enh_haut_donnees_piege_j, "Bloc2_enh_haut")
Bloc2_enh_ras_donnees_piege_s = donnees_piege_semaine (Bloc2_enh_ras_donnees_piege_j, "Bloc2_enh_ras")