# Backtranslation

Traduire un texte dans une langue target puis retraduire dans la langue source pour obtenir une variante du texte.

In [8]:
from transformers import pipeline

from typing import List, Dict

## Backtranslation avec MarianMT

Les résultats sont plutôt bons mais il n'y a pas beaucoup de variation : quelques mots changent mais c'est tout. Il faudrait peut-être en introduire avec genre des synonymes ou des masques.

In [2]:
# Chargement des pipelines
mt_translator = pipeline("translation_en_to_fr", model = "Helsinki-NLP/opus-mt-en-fr")
mt_backtranslator = pipeline("translation_fr_to_en", model = "Helsinki-NLP/opus-mt-fr-en")

In [7]:
def backtranslate(input: str, translator, backtranslator, k = 2) -> List[str]:
    """Backtranslate un `input`.
    
    L'`input` est traduit avec le `translator` dans une langue cible et est ensuite
    retraduit de la langue cible à la langue source avec `backtranslator`. Pour un `input`,
    on obtient `k` backtranslations.

    Args:
        input (str): l'input à backtranslate
        translator (TranslationPipeline): pipeline pour traduire de la langue source à la langue cible
        backtranslator (TranslationPipeline): pipeline pour traduire de la langue cible à la langue source
        k (int, optional): le nombre de backtranslations à renvoyer. Par défaut 2.

    Returns:
        List[str]: les backtranslations de l'input sous la forme d'une liste de strings
    """
    translated = translator(input, max_length=1000)[0]["translation_text"]
    backtranslations = backtranslator(translated, max_length=1000, num_return_sequences=k)
    return [synopsis["translation_text"] for synopsis in backtranslations]

In [9]:
synopsis = """
    Mike, after his release from a psychiatric hospital, teams up with his old pal Reggie to hunt down the Tall Man, who is at it again. A mysterious, beautiful girl has also become part of Mike's dreams, and they must find her before the Tall Man does.
"""

backtranslations = backtranslate(synopsis, translator=mt_translator, backtranslator=mt_backtranslator)
backtranslations

["Mike, after leaving a psychiatric hospital, teamed up with his old friend Reggie to track down the Tall Man, who is there again. A mysterious and beautiful girl has also become part of Mike's dreams, and they have to find her before the Tall Man.",
 "Mike, after leaving a psychiatric hospital, teamed up with his old friend Reggie to track down the Tall Man, who is there again. A mysterious and beautiful girl also became part of Mike's dreams, and they must find her before the Tall Man."]