## Activité 3 : Analyse d’un complexe avec PyMOL

On ajoute un élément au `python search path` afin de pouvoir utiliser nos 
fonctions et modules :

In [1]:
import sys

TXT_PROJ_ROOT = "/home/gml/Documents/Master/M1_BIBS/S2/Structurale/"

if TXT_PROJ_ROOT not in sys.path:
    sys.path.append(TXT_PROJ_ROOT)
    print("Added project root to Python search path")
else:
    print("Project root already present in Python search path")

Added project root to Python search path


Classes pour manipuler plus facilement les chemins d'accès en Python :

In [63]:
from piestruct.utils.customobjs import (ObjDict as odict, Path as path)
from piestruct.utils.customfuncs import udir

Modules nécessaires pour faire l'analyse structurale :

In [3]:
import Bio.PDB as pdb
import freesasa
import nglview as nv



In [4]:
proj_root = path(TXT_PROJ_ROOT)

In [5]:
pdb_files = proj_root.joinpath("data").dglob("*.pdb")
pdb_files

{'1he8.pdb': PosixPath('/home/gml/Documents/Master/M1_BIBS/S2/Structurale/data/1he8.pdb'),
 '1HE8_AB_c.pdb': PosixPath('/home/gml/Documents/Master/M1_BIBS/S2/Structurale/data/1HE8_AB_c.pdb'),
 '1e8y.pdb': PosixPath('/home/gml/Documents/Master/M1_BIBS/S2/Structurale/data/1e8y.pdb'),
 '121p.pdb': PosixPath('/home/gml/Documents/Master/M1_BIBS/S2/Structurale/data/121p.pdb')}

## Créer les structures

In [21]:
(prot_s_sasa := freesasa.Structure( pdb_files["1HE8_AB_c.pdb"].abs )) 

<freesasa.Structure at 0x7f5eb8d0f780>

In [22]:
(prot_c_sasa := freesasa.calc(prot_s_sasa))

<freesasa.Result at 0x7f5eb8d30690>

In [78]:
# Attention : J'ai mis l'argument QUIET=True pour cacher les alertes issues de l'importation
# du fichier. D'après la doc officielle de BioPython, ces "Warnings" sont des indicateurs
# de problèmes dans la structure du fichier PDB. À RETENIR.
(prot_biopy := pdb
 .PDBParser(QUIET=True)
 .get_structure(id="1HE8", file=pdb_files["1HE8_AB_c.pdb"].abs)
)

<Structure id=1HE8>

**Notes sur les structures PDB de BioPython** :

La fonction `Bio.PDB.PDBParser().get_structure` renvoie un objet de type `Structure(Bio.PDB.Entity.Entity)`.
Celui-ci est "subscriptable" comme une liste. Chacun des éléments, sera alors un modèle `Model(Bio.PDB.Entity.Entity)`. 

Voir `help(prot_biopy[0])`

...
   
   The object representing a model in a structure.
   
   In a structure derived from an X-ray crystallography experiment,
   only a single model will be present (with some exceptions). NMR
   structures normally contain many different models.
   
   Method resolution order:
       Model
       Bio.PDB.Entity.Entity
       builtins.object

In [58]:
prot_m_biopy = prot_biopy[0]

**Note on views** : These are not rendered on the html version of the notebook. To visualise them download the notebook and import a pdb file.

In [50]:
(view_A := nv.show_biopython(prot_biopy[0]["A"]))

NGLWidget()

In [48]:
(view_B := nv.show_biopython(prot_biopy[0]["B"]))

NGLWidget()

In [49]:
(view_full := nv.show_biopython(prot_biopy))

NGLWidget()

### Tâche 3.1

1. De quelles protéines s’agit-il ?

Il s'agit du complexe Ras G12V - PI 3-kinase gamma. C'est un hétéro-2-mère A1B1 asymétrique, dont la fonction est importante pour la survie de cellules transformées (_Ras activation of phosphoinositide 3-kinase (PI3K) is important for survival of transformed cells_).

2. Combien de chaînes polypeptidiques contient le fichier PDB ? Combien de résidus par chaîne ?

In [25]:
# via BioPython
sum(1 for chain in prot_biopy.get_chains())

2

In [77]:
# via BioPython
for chain in prot_m_biopy.get_chains():
    print(f"Chain {chain.id} : {sum(1 for i in chain.get_residues())}")

Chain A : 749
Chain B : 166


In [36]:
prot_resid_areas = prot_c_sasa.residueAreas()

In [38]:
# via freesasa 
for chain in prot_resid_areas.keys():
    print(f"chain {chain} : {sum(1 for residue in prot_resid_areas[chain])} residues")

chain A : 749 residues
chain B : 166 residues


La structure PDB `1HE8_AB_c` contient deux chaînes, A et B. La chaîne A contient 766 résidus, c'est-à-dire plus de quatre fois plus que la chaîne B. Ceci nous mène à dire qu'il s'agit d'un hétéro-dimère. Ceci est en accord avec les informations trouvées sur la fiche `RCSB PDB`.

### Tâche 3.2
Allez voir les fiches Uniprot correspondantes aux deux monomères en utilisant les liens dans la fiche du
PDB

Pour chaque protéine dans le complexe, répondez aux questions suivantes :
1. La structure PDB représente-t-elle la protéine entière ou une portion ?
2. La protéine est composée de plusieurs domaines ?
3. Quelle est la fonction (putative) de la protéine ? et de ses domaines ?

#### Chaîne A : UniProtKB - [P48736 (PK3CG_HUMAN)](https://www.uniprot.org/uniprot/P48736)

1. La structure PDB ne représente qu'une portion de cette protéine, vu que les longueurs de séquence ne coincident pas : 

$$
    len(1HE8_{A}) = 965 \;\;\;\; len(P48736) = 1102
$$

On trouve aussi une description plus detaillée dans la section **Structure**, l'entrée PDB _1HE8_ correspond aux positions $144-1102$

2. La protéine est composée de plusieurs domaines ?

Oui, ce sont [les suivants](https://www.uniprot.org/uniprot/P48736#family_and_domains) :


| Feature key | Position(s) | Description  | Putative Function |
|-------------|-------------|--------------|----------|
| Domain  |  34 – 141   |  PI3K-ABD     | The adaptor-binding domain (ABD) binds to p85, the regulatory subunit. |
| Domain  |  217 – 309  |  PI3K-RBD     |  PI3K RBD is a Ras-binding domain. |
| Domain  |  357 – 521  |  C2 PI3K-type |  The putative membrane-binding PI3K-type C2 domain is an eight- stranded antiparallel beta-sandwich consisting of two four-stranded beta- sheets.  |
| Domain  |  541 – 723  |  PIK helical  | The phosphoinositide kinase (PIK) domain is a region conserved among all PI3 and PI4-kinases and although its role is presently unclear, it is likely to be involved in substrate presentation |
| Domain  |  828 – 1073 |  PI3K/PI4K    |  	Phosphorylates phosphoinositides on the 3-hydroxyl group of the inositol ring. |


3. Quelle est la fonction (putative) de la protéine ? et de ses domaines ?

Les fonctions sont détailles dans [cette section](https://www.uniprot.org/uniprot/P48736#function).
Elle possède plusieurs fonctions putatives :

    * Phosphorilation ( PtdIns(4,5)P2 ==> PIP3 )
    * Activation de cascades de signalisation liées à la croissance/developement cellulaires, survie, proliferation, motilité et morphologie.
    * Nécessaire pour le developement et la signalisation de lymphocyte B
    
Pour les fonctions de chacun des domaines, voir le tableau précédent.

#### Chaîne B : UniProtKB - [P01112 (RASH_HUMAN)](https://www.uniprot.org/uniprot/P01112)

1. La structure PDB représente-t-elle la protéine entière ou une portion ?



2. La protéine est composée de plusieurs domaines ?
3. Quelle est la fonction (putative) de la protéine ? et de ses domaines ?