# Python en R

On va se baser sur le script python que vous avez développé dans un précédent TD, mais dans une version un peu modifiée. Les commentaires ont étés supprimés, le code a été compacté et les fonctions graphiques supprimées (ainsi que l’import de matplotlib). J’ai aussi retiré la fonction principale, cette dernière n’a plus d’intérêt. Avec ces modifications notre fonction est maintenant prête à être importée comme une bibliothèque externe.

------

### Mise en place (R)

On commence par installer le package *reticulate* qui va nous permettre d’interface R et python.

```R
install.packages("reticulate",repos="https://cloud.r-project.org")
```

Puis, comme avec toutes les bibliothèques R, on charge le package avec la commande **library.**

```R
library(reticulate)
```

Enfin on définit le répertoire de travail (n’oubliez pas de modifier le chemin en fonction de l’emplacement de votre fichier). Le fichier contenant la nouvelle version des *k-means* doit bien évidement se trouver dans ce dossier. La fonction **list.files()** permet d’en vérifier la présence.

```R
# "./TD_IGAST_MultiVar" est le chemin du répertoire de travail
setwd("./TD_IGAST_MultiVar")
list.files()
```

On peut désormais importer le module python avec la fonction *import_from_path()* du package *reticulate.*

```R
# "kmeans" est le nom du fichier python (sans l'extension)
# getwd() renvoie le chemin du répertoire de travail
m_kmeans <- import_from_path("kmeans", getwd())
```

Cette fonction crée un environnement (que j’appelle *m_kmeans* pour éviter de surcharger la fonction *kmeans* de R) qui contient toutes les fonctions contenues dans le fichier python importé. On peut alors utiliser les fonctions écrites en python de la manière suivante:

```R
m_kmeans$maFonction()
```

Le système n’est pas encore totalement fonctionnel car nous devons veiller à ce que les types des objets transmis par R correspondent à ceux attendus par python.

Le tableau ci-dessous, extrait de la [documentation](https://cran.r-project.org/web/packages/reticulate/vignettes/introduction.html#type-conversions), décrit les équivalences de types dans chacun des deux langages.

R |	Python | Exemples
:-|:-------|:---------
Single-element vector |	Scalar |	1, 1L, TRUE, "foo" 
Multi-element vector | List | c(1.0, 2.0, 3.0), c(1L, 2L, 3L) 
List of multiple types | Tuple | list(1L, TRUE, "foo") 
Named list | Dict |	list(a = 1L, b = 2.0), dict(x = x_data) 
Matrix/Array | NumPy ndarray | matrix(c(1,2,3,4), nrow = 2, ncol = 2)
Function | Python function | function(x) x + 1 
NULL, TRUE, FALSE | None, True, False | NULL, TRUE, FALSE 

Pour finir voici une nouvelle fonction en R qui sera chargée de vérifier que les types correspondent bien à ce qui est attendu et qui se chargera d'appeler la fonction écrite en python.

```R
f_kmeans <- function(data, nclass, p=2){

    # On vérifie que le nombre de classes soit
    # un entier (R à tendance à tout définir comme
    # des flotants) et on caste le cas échéant
    if (!is.integer(nclass)){
        nclass <- as.integer(nclass)
    }
     
    # On veut que data soit une matrice
    if (!is.matrix(data)){
        # Exception, la fonction se stope
        # et renvoie un message d'erreur
        stop("data must be a matrix")
    }

    # Identique au premier test mais pour p
    if (!is.integer(p)){
        p <- as.integer(p)
    }
    
    # Calcul des minimumns et maximums
    # Comme data est de type *matrix* on peut
    # calculer directement le minimum et le maximum
    # de toute la matrice
    absolute_min = min(data)
    absolute_max = max(max)
    
    # Calcul d'epsilon
    epsilon = 10**(-10.0) * (absolute_max - absolute_min)
    
    # Appel de la fonction python
    out <- m_kmeans$kmeans(u_data, nclass, p, epsilon)
    
    return(out)
}
```

-----

### Utilisation

On peut désormais utiliser la fonction **f_kmeans()** en lui passant comme arguments une matrice de données, un nombre de classes et un exposant (valeur facultative).

```R
km <- kmeans(data, 5)
```

----

### Plus d'informations

Si vous voulez plus d'informations sur le package *reticulate* vous pouvez consulter les liens suivants:
* La page du package sur le [CRAN](https://cran.r-project.org/web/packages/reticulate/index.html)
* La [documentation](https://cran.r-project.org/web/packages/reticulate/reticulate.pdf) du package
* Ainsi que la vignette [d'introduction](https://cran.r-project.org/web/packages/reticulate/vignettes/introduction.html)