In [1]:
from utils.FilePreparator import ADN_sequence_1, ADN_sequence_2
import Chatbot

# Commencer ici
L'évolution est l'histoire d'un changement au fil du temps, et au cœur de tout cela se trouve l'ADN. Tout comme une faute de frappe dans un livre peut en changer le sens, les mutations de l'ADN peuvent modifier les protéines pour lesquelles il est codé, ce qui se traduit par des caractéristiques différentes chez les organismes vivants. Aujourd'hui, nous allons nous mettre dans la peau de biologistes de l'évolution et explorer comment des changements, même minimes, dans les séquences d'ADN peuvent entraîner des variations spectaculaires dans l'apparence de l'organisme concerné. Préparez-vous à plonger dans le code de la vie et à découvrir les mécanismes qui sous-tendent l'évolution génétique !
# Contexte biologique
## Le poisson zèbre
poisson zèbre ...  

## Traduction biologique
Une façon de distinguer les deux séquences génétiques du poisson zèbre est de les traduire en polypeptides correspondants. Récapitulons d'abord comment la traduction se fait en théorie.  

Pour traduire une séquence d'ADN en un polypeptide (chaîne d'acides aminés), plusieurs étapes sont nécessaires. Tout d'abord, nous devons traduire la séquence d'ADN en ARNm, qui est complémentaire et transcrit. Cette procédure peut être décomposée en deux sous-étapes :  

<span style="color:orange">step 1.1:</span>  
Les bases doivent être remplacées par leurs homologues (cette séquence correspond à la séquence du brin opposé) :  
| Brin 1 | Brin 2 |
|----------|----------|
| A    | T   |
| T    | A   |
| G    | C   |
| C    | G   |  

<span style="color:magenta">step 1.2:</span>  
Les bases thymine $T$ doivent alors être remplacées par l'uracile $U$ :
| Brin 2 | mRNA |
|----------|----------|
| A    | A   |
| _T_    | _U_   |
| G    | G   |
| C    | C   |  

Nous avons maintenant traduit la séquence d'ADN en la séquence d'ARNm correspondante.  

<span style="color:cyan">step 2:</span>  
Une fois que nous avons trouvé la séquence de l'ARNm, nous pouvons utiliser le code génétique pour traduire la séquence en polypeptide.  

## Objectifs
Comme la traduction prendrait beaucoup trop de temps à la main, nous voulons écrire un code de programme avec le langage de programmation "Python" qui fait le travail pour nous. Vous n'avez jamais programmé auparavant ? Pas de problème, suivez ce modèle et vous apprendrez :
1. intuitivement comment traduire le code génétique à la main.
2. de manière interactive comment transférer votre procédure en code.



# Étape 1
Dans la première étape, notre objectif est de traduire à la main une courte séquence d'ADN et de transférer notre procédure dans le code du programme.  
## Tâches
__1a)__
Traduire la séquence d'ADN ``ADN_brin_1 = ATGAGGACA`` en la séquence du brin opposé ``ADN_brin_2`` selon la procédure suivante <span style="color:orange">step 1.1:</span> décrite ci-dessus.  
Prenez des notes sur la façon dont vous avez procédé.  

__1b)__
Ecrivez un code de programme Python qui fait la même chose que ce que vous avez fait dans la __Tâche 1__. Lorsque vous avez besoin d'aide, ouvrez le fichier ``Robofriend.ipynb`` dans un autre onglet et commencez une conversation avec le chatbot.  
Il n'a pas d'informations de base, alors dites-lui ce que vous avez fait jusqu'à présent et demandez-lui s'il peut vous aider dans votre tâche actuelle.  

__1c)__
Si votre code fonctionne, vous devriez maintenant avoir produit une séquence appelée ``ADN_brin_2`` avec du code. Correspond-elle à votre résultat de la __Tâche 1__ ?  
Si oui, vous pouvez passer à l'étape suivante, sinon essayez de trouver l'erreur vous-même ou demandez de l'aide à votre professeur.

In [None]:
run Chatbot

In [None]:
# Définis la séquence d'ADN que tu veux traduire.
ADN_sequence = "ATGAGGACA"#ADN_sequence_1

In [None]:
# Définir le dictionnaire du second brin de l'ADN.
ADN_switch_strand_dict = {'A': 'T', 'T': 'A', 'G': 'C', 'C': 'G'}

In [None]:
# Fonction de changement de brin d'ADN.
def switch_strand(ADN_sequence):
    ADN_switch_strand = ""
    for nucleotide in ADN_sequence:
        ADN_switch_strand += ADN_switch_strand_dict[nucleotide]
    return ADN_switch_strand
ADN_inverse = switch_strand(ADN_sequence)
print(ADN_inverse)

# Étape 2
Dans cette étape, nous compléterons le code du programme pour traduire complètement la séquence d'ADN en polypeptide correspondant.  
## Tâches
__2a\)__
exécuter la traduction<span style="color:magenta">step 1.2</span> pour obtenir une séquence d'``ARNm`` et<span style="color:cyan">step 2</span> pour obtenir une séquence ``polypeptide`` à la main.


__2b)__  
Ecrivez un code de programme Python qui prend le ``ADN_brin_2`` et produit une séquence ``ARNm`` en exécutant <span style="color:cyan">l'étape 2</span>. Utilisez vos résultats précédents de l'__étape 1__ comme guide et comparez la séquence obtenue avec celle que vous avez obtenue dans la __Tâche 2a__.  

__2c)__
Étudiez la fonction ``translate_genetic_sequence`` et prenez des notes. Comprenez-vous ce qu'elle fait ? Si ce n'est pas le cas, demandez au Chatbot.  
Ensuite, exécutez la fonction ``translate_genetic_sequence`` en utilisant la séquence ``ARNm`` pour produire une séquence ``polypeptidique``. Est-ce que cela correspond à vos résultats précédents ?

In [None]:
# Définir un dictionnaire pour la conversion ADN vers ARNm.
ADN_to_ARNm_dict = {'A': 'U', 'T': 'A', 'C': 'G', 'G': 'C'}

In [None]:
# Fonction de conversion de l'ADN en ARNm.
def ADN_to_ARNm(sequence):
    ARNm_sequence = ''
    for nucleotide in sequence:
        ARNm_sequence += ADN_to_ARNm_dict[nucleotide]
    return ARNm_sequence

ARNm_sequence = ADN_to_ARNm(ADN_inverse)
print(f"ARNm sequence: {ARNm_sequence}")

In [None]:
# Définir un dictionnaire pour les codons et les acides aminés correspondants.
codon_table = {
    "UUU": "Phe", "UUC": "Phe", "UUA": "Leu", "UUG": "Leu",
    "CUU": "Leu", "CUC": "Leu", "CUA": "Leu", "CUG": "Leu",
    "AUU": "Ile", "AUC": "Ile", "AUA": "Ile", "AUG": "Met",
    "GUU": "Val", "GUC": "Val", "GUA": "Val", "GUG": "Val",
    "UCU": "Ser", "UCC": "Ser", "UCA": "Ser", "UCG": "Ser",
    "CCU": "Pro", "CCC": "Pro", "CCA": "Pro", "CCG": "Pro",
    "ACU": "Thr", "ACC": "Thr", "ACA": "Thr", "ACG": "Thr",
    "GCU": "Ala", "GCC": "Ala", "GCA": "Ala", "GCG": "Ala",
    "UAU": "Tyr", "UAC": "Tyr", "UAA": "FIN", "UAG": "FIN",
    "CAU": "His", "CAC": "His", "CAA": "Gln", "CAG": "Gln",
    "AAU": "Asn", "AAC": "Asn", "AAA": "Lys", "AAG": "Lys",
    "GAU": "Asp", "GAC": "Asp", "GAA": "Glu", "GAG": "Glu",
    "UGU": "Cys", "UGC": "Cys", "UGA": "FIN", "UGG": "Trp",
    "CGU": "Arg", "CGC": "Arg", "CGA": "Arg", "CGG": "Arg",
    "AGU": "Ser", "AGC": "Ser", "AGA": "Arg", "AGG": "Arg",
    "GGU": "Gly", "GGC": "Gly", "GGA": "Gly", "GGG": "Gly",
}

In [None]:
# Function to translate a genetic sequence into a protein
def translate_genetic_sequence(sequence):
    polypeptide = ""
    for i in range(0, len(sequence), 3):
        codon = sequence[i:i+3]
        amino_acid = codon_table.get(codon, "-")
        if amino_acid == "FIN":
            break
        else:
            polypeptide += amino_acid

    return polypeptide


# Étape 3
Dans cette dernière étape, nous allons déterminer laquelle des séquences d'ADN ``ADN_séquence_1`` et ``ADN_séquence_2`` est la version originale et laquelle est la version mutée du gène du poisson zèbre.

## Tâches
__3a)__
Au début, nous avons utilisé la courte séquence d'ADN ``ATGAGGACA``, maintenant remplacez-la par ``ADN_séquence_1`` et exécutez la cellule suivante. Notez la longueur de la séquence polypeptidique et répétez la même chose avec ``ADN_séquence_2``.

La longueur des deux séquences polypeptidiques devrait être différente. Le fait que vos résultats de la tâche 3a ne reflètent pas cela est dû au fait que la fonction ``translate_genetic_sequence`` ne termine pas la séquence, si les codons stop ``UAA``, ``UAG`` ou ``UGA`` apparaissent.  

__3b)__
Découvrez ce que la fonction ``translate_genetic_sequence`` ajoute au ``polypeptide`` lorsqu'elle traite un codon stop. Étudiez donc la table des codons.  
En utilisant cette information, implémentez une instruction If Else dans la fonction ``translate_genetic_sequence`` pour qu'elle s'arrête lorsqu'un codon stop est traité. Demandez de l'aide au chatbot si vous en avez besoin.  

__3c)__
Vérifiez à nouveau la longueur de ``ADN_séquence_1`` et de ``ADN_séquence_2``. Pouvez-vous dire maintenant quelle est la séquence originale et quelle est la version mutée ?  
Si oui, bravo, vous êtes un génie de la programmation et vous êtes bien préparé pour étudier la bio-informatique.

In [None]:
# Translate the genetic sequence into a protein
polypeptide = translate_genetic_sequence(ARNm_sequence)

# Display the translated protein sequence
print("Translated polypeptide sequence:", polypeptide)
print("Length of polypeptide sequence:", int(len(polypeptide)/3))