### Para nuestro Alineamiento Multiple es necesario tener un grupo de secuencias a tratar. Supongamos que queremos alinear varias secuencias de proteinas de membrana. 
### Buscamos una proteina y su codigo uniprot arbitrariamente, y con la ayuda de las herramientas de Biopython sacamos su secuencia.

In [1]:
from Bio import ExPASy
from Bio import SwissProt

code = "Q16720"
handle = ExPASy.get_sprot_raw(code)
protein = SwissProt.read(handle)
secuencia = protein.sequence


###Lo siguiente es realizar un Blast de esta secuencia, con el fin de encontrar un grupo de secuencias similares para alinear. En este caso se toman los 10 primeros hit de Blast
###Y luego esas 10 secuencias las guardamos en formato fasta en un solo archivo.

In [2]:
#Ya que es un blast remoto, veces es conveniente guardar el resultado del Blast en el directorio. 
from Bio.Blast import NCBIWWW
result = NCBIWWW.qblast("blastp", "pdb", secuencia, hitlist_size=10, )
save_file = open("my_blast.xml", "w") #Se guarda el resultado del Blast en el formato .xml estandar.
save_file.write(result.read())
save_file.close()
result.close()

In [3]:
from Bio.Blast import NCBIXML
result = open("my_blast.xml")
blast_record = NCBIXML.read(result)
#blast_record = records.next()
archivo = open("result.fasta","w")
for alignment in blast_record.alignments:
    for hsp in alignment.hsps:
        if hsp.expect < 0.1:
            # tomamos la id y la secuencia subject de cada hit
            ides =  alignment.hit_id
            sequence = hsp.query
            archivo.write(">%s\n%s*\n" %(ides,sequence))
            
archivo.close()

### Biopython posee una herramienta que permite utilizar las funciones de Mafft previamente instalado, a travez de una funcion de tipo wrapper ( MafftCommandline). Basicamente esta funcion wrapper llama a otra funcion, en este caso seria el programa Mafft.
###Biopython posee este tipo de herramientas para muchos otros programas de alineamiento multiple, como Clustalw, Muscle, TCofee, Prank, Probcons, entre otros.

In [4]:
from Bio.Align.Applications import MafftCommandline
mafft_cline = MafftCommandline(input="result.fasta")
# stdout es donde estan los resultados de Mafft, stderr es donde esta los errores , en caso de que los hubiera.
#El alineamiento se ejecuta cuando hacemos "mafft_cline()"
stdout, stderr = mafft_cline()
#StringIO posee funciones para analizar texto almacenado en la memoria
#AlignIO permite manejar los alineamientos
#Podemos escoger el formato del output con ".format()". Si solo hacemos "print aling" el formato sera fasta.
from io import StringIO 
from Bio import AlignIO
aling = AlignIO.read(StringIO(stdout),"fasta")
print(aling.format("clustal"))


CLUSTAL X (1.81) multiple sequence alignment


gi|1482416980|pdb|6A69|A            MGDMANSSIEFHPKPQQQRDVPQAGGFGCTLAELRTLMELRGAEALQKIE
gi|380764197|pdb|3TLM|A             --------------------------------------------------
gi|973744028|pdb|4YCM|A             --------------------------------------------------
gi|459358419|pdb|3W5B|A             --------------------------------------------------
gi|18159010|pdb|1KJU|A              --------------------------------------------------
gi|313507262|pdb|2DQS|A             --------------------------------------------------
gi|586500077|pdb|4BEW|A             --------------------------------------------------
gi|567755577|pdb|4NAB|A             --------------------------------------------------
gi|1335513308|pdb|5MPM|A            --------------------------------------------------
gi|163311048|pdb|3BA6|A             --------------------------------------------------

gi|1482416980|pdb|6A69|A            EAYGDVSGLCRRLKTSPTEGLADNTNDLEKRRQIYGQNFIPPKQPK

In [5]:
#Si quieren guardar el alineamiento en un archivo y luego ocupar su info.

stdout, stderr = mafft_cline()
aling = AlignIO.read(StringIO(stdout),"fasta")
aling_c = aling.format("clustal")
with open("alineamiento.fasta", "w") as f:
    f.write(aling_c)


## Ejemplo del uso de listas y bucle for

In [42]:
lista1 = ["victor",10,4.5,"pedro"]
lista1.append("andres")

In [46]:
lista1[2]

4.5

In [45]:
for x in lista1:
    print(x)
    print(x*2)

victor
victorvictor
10
20
4.5
9.0
pedro
pedropedro
andres
andresandres
