In [2]:
# ============================================
#   Script : T√©l√©chargement et analyse ADN
#   Auteur : Usto Informatique
#   Objectif : T√©l√©charger une s√©quence NCBI,
#               la convertir en FASTA et analyser sa composition
# ============================================

from Bio import Entrez, SeqIO
from collections import Counter

# 1Ô∏è‚É£ Configuration Entrez (obligatoire pour acc√©der √† NCBI)
Entrez.email = "alaegmr98@gmail.com"  # Remplace par ton email

# 2Ô∏è‚É£ T√©l√©charger la s√©quence depuis la base NCBI
accession_id = "PX436992"  # Identifiant d'acc√®s (exemple)

print("üîç T√©l√©chargement de la s√©quence depuis NCBI...")
handle = Entrez.efetch(
    db="nucleotide",     # Base de donn√©es : s√©quences ADN/ARN
    id=accession_id,     # Identifiant de la s√©quence
    rettype="gb",        # Format GenBank
    retmode="text"       # Mode texte lisible
)

# 3Ô∏è‚É£ Lecture du fichier GenBank
record = SeqIO.read(handle, "genbank")
handle.close()
print("‚úÖ S√©quence r√©cup√©r√©e avec succ√®s.\n")

# 4Ô∏è‚É£ Enregistrement de la s√©quence au format FASTA
fasta_filename = accession_id + ".fasta"
SeqIO.write(record, fasta_filename, "fasta")
print(f"üíæ Fichier FASTA enregistr√© : {fasta_filename}\n")

# 5Ô∏è‚É£ Affichage des m√©tadonn√©es
print("=== M√âTADONN√âES ===")
print("Identifiant :", record.id)
print("Description :", record.description)
print("Organisme   :", record.annotations.get("organism", "Inconnu"))

# R√©cup√©rer le nom du g√®ne si pr√©sent dans les features
gene_name = "Inconnu"
for feature in record.features:
    if feature.type == "gene" and "gene" in feature.qualifiers:
        gene_name = feature.qualifiers["gene"][0]
        break

print("G√®ne associ√©:", gene_name)
print("Longueur     :", len(record.seq), "bases\n")

# 6Ô∏è‚É£ Afficher la s√©quence brute
print("=== S√âQUENCE ===")
print(record.seq)
print("\n")

# 7Ô∏è‚É£ Comptage des bases (A, T, C, G)
sequence = record.seq.upper()
counts = Counter(str(sequence))

print("=== FR√âQUENCES DES BASES ===")
for base in "ATCG":
    print(f"{base} : {counts.get(base, 0)}")

# 8Ô∏è‚É£ Calcul manuel du pourcentage GC
gc_count = counts["G"] + counts["C"]
length = len(sequence)
gc_percent = (gc_count / length) * 100

print(f"\n‚úÖ Pourcentage GC : {gc_percent:.2f}%")


üîç T√©l√©chargement de la s√©quence depuis NCBI...
‚úÖ S√©quence r√©cup√©r√©e avec succ√®s.

üíæ Fichier FASTA enregistr√© : PX436992.fasta

=== M√âTADONN√âES ===
Identifiant : PX436992.1
Description : Homo sapiens isolate AB17 BRCA1 protein (BRCA1) gene, partial cds
Organisme   : Homo sapiens
G√®ne associ√©: BRCA1
Longueur     : 350 bases

=== S√âQUENCE ===
CCTGATGGGTTGTGTTTGGTTTCTTTCAGCATGATTTTGAAGTCAGAGGAGATGTGGTCAATGGAAGAAACCACCAAGGTCCAAAGCGAGCAAGAGAATCCCAGGACAGAAAGGTAAAGCTCCCTCCCTCAAGTTGACAAAAATCTCACCCCACCACTCTGTATTCCACTCCCCTTTGCAGAGATGGGCCGCTTCATTTTGTAAGACTTATTACATACATACACAGTGCTAGATACTTTCACACAGGTTCTTTTTTCACTCTTCCATCCCAACCACATAAATAAGTATTGTCTCTACTTTATGAATGATAAAACTAAGAGATTTAGAGAGGCTGTGTATTGGGGATTCCC


=== FR√âQUENCES DES BASES ===
A : 102
T : 100
C : 80
G : 68

‚úÖ Pourcentage GC : 42.29%


In [3]:
# ============================================
# 5Ô∏è‚É£ Requ√™te BLAST en ligne
# ============================================

from Bio.Blast import NCBIWWW, NCBIXML

print("\nüîç Lancement d'une recherche BLAST en ligne...")
# qblast(programme, base_de_donn√©es, s√©quence)
result_handle = NCBIWWW.qblast("blastn", "nt", record.seq)

# Sauvegarde du r√©sultat au format XML (optionnel mais conseill√©)
blast_xml_file = accession_id + "_blast.xml"
with open(blast_xml_file, "w") as out_handle:
    out_handle.write(result_handle.read())
result_handle.close()
print(f"üíæ R√©sultats BLAST enregistr√©s dans : {blast_xml_file}\n")

# ============================================
# 6Ô∏è‚É£ Lecture et analyse des r√©sultats BLAST
# ============================================

# Lire le fichier XML
result_handle = open(blast_xml_file)
blast_records = NCBIXML.parse(result_handle)

print("=== MEILLEURS ALIGNEMENTS ===")
for blast_record in blast_records:
    for alignment in blast_record.alignments[:5]:  # Top 5 r√©sultats
        for hsp in alignment.hsps[:1]:  # Premier HSP (High-scoring Pair)
            identity = (hsp.identities / hsp.align_length) * 100
            print(f"Accession : {alignment.accession}")
            print(f"e-value   : {hsp.expect:.2e}")
            print(f"Identit√©  : {identity:.2f}%\n")
    break  # On ne traite qu‚Äôune seule requ√™te √† la fois

result_handle.close()
print("‚úÖ Analyse BLAST termin√©e.")



üîç Lancement d'une recherche BLAST en ligne...
üíæ R√©sultats BLAST enregistr√©s dans : PX436992_blast.xml

=== MEILLEURS ALIGNEMENTS ===
Accession : AY273801
e-value   : 2.63e-172
Identit√©  : 99.14%

Accession : DQ190451
e-value   : 2.63e-172
Identit√©  : 99.14%

Accession : DQ190455
e-value   : 2.63e-172
Identit√©  : 99.14%

Accession : L78833
e-value   : 2.63e-172
Identit√©  : 99.14%

Accession : NG_005905
e-value   : 2.63e-172
Identit√©  : 99.14%

‚úÖ Analyse BLAST termin√©e.
