**0. Instalar Biopython**
https://biopython.org/


In [None]:
!pip install BioPython

import Bio

import matplotlib
import matplotlib.pyplot as plt
import copy

from Bio import Phylo


**1. Construção de uma árvore filogenética a partir de uma matriz de distâncias**

In [None]:
# O módulo TreeConstruction tem métodos baseados em distâncias para criar árvores filogenéticas
# https://biopython.org/docs/1.76/api/Bio.Phylo.TreeConstruction.html
# https://biopython.org/wiki/Phylo

from Bio.Phylo.TreeConstruction import DistanceTreeConstructor
from Bio.Phylo.TreeConstruction import DistanceCalculator
from Bio.Phylo.TreeConstruction import _DistanceMatrix


In [None]:
# Função para efetuar a leitura de uma matriz de um ficheiro de texto

def read_distance_matrix_standard(name):
    distance_matrix = []
    try:
        with open(name, 'r') as f:
            for line in f:
                # Strip whitespace, split by spaces/tabs, and convert to float
                row = [float(num) for num in line.strip().split()]
                distance_matrix.append(row)
        return distance_matrix
    except FileNotFoundError:
        print(f"Error: The file at {filepath} was not found.")
        return None
    except ValueError:
        print("Error: The file contains non-numeric data.")
        return None


In [None]:
# Ler a matriz do ficheiro b.txt

name = 'b.txt'
b = read_distance_matrix_standard(name)

b

In [None]:
# Converter a matriz para um objeto do tipo DistanceMatrix
# Deve ter apenas o triângulo inferior

names = ['A', 'B', 'C', 'D', 'E']
mat = _DistanceMatrix(names, b)
print(mat)


In [None]:
# Criar um construtor e aplicar o método UPGMA para obter a árvore filogenética

cUPGMA = DistanceTreeConstructor()
upgmatree = cUPGMA.upgma(mat)

Phylo.draw_ascii(upgmatree)

In [None]:
# Criar um construtor e aplicar o método NJ para obter a árvore filogenética

cNJ = DistanceTreeConstructor()
NJtree = cNJ.nj(mat)

Phylo.draw_ascii(NJtree)

In [None]:

Phylo.draw(upgmatree, branch_labels=lambda c: f'{c.branch_length:.2f}' if c.branch_length else '')


In [None]:
Phylo.draw(NJtree, branch_labels=lambda c: f'{c.branch_length:.2f}' if c.branch_length else '')


**Questão:**

1. Analise as árvores e identifique semelhanças e diferenças

In [None]:
# Adicionar raiz a uma árvore sem raiz

# 1. Escolher um outgroup
# 2. Adicionar no ponto médio

import copy

NJ_R1 = copy.deepcopy(NJtree)

NJ_R2 = copy.deepcopy(NJtree)



In [None]:
# 1. Outgroup

NJ_R1.root_with_outgroup('C')

Phylo.draw(NJ_R1, branch_labels=lambda c: f'{c.branch_length:.2f}' if c.branch_length else '')


In [None]:
# 2. Raiz no ponto médio do caminho mais longo entre terminais

NJ_R2.root_at_midpoint()

Phylo.draw(NJ_R2, branch_labels=lambda c: f'{c.branch_length:.2f}' if c.branch_length else '')



**2. Construção de uma árvore filogenética a partir de um alinhamento múltiplo**

In [None]:

# Ler o alinhamento múltiplo armazenado no ficheiro A.phylip.
# O alinhamento está no formato phylip

from Bio import AlignIO
aln = AlignIO.read('A.phylip', 'phylip')
print(aln)

In [None]:
# O objeto DistanceCalculator cria uma matriz de distâncias baseada num alinhamento multiplo
# Calcula as diferenças entre posições alinhadas utilizando um modelo de substituição
# Consultar detalhes aqui: https://biopython.org/docs/1.76/api/Bio.Phylo.TreeConstruction.html

# O parâmetro do método especifica a matriz de substituição a adotar

# Modelos DNA: 'identity', 'blastn', ...
# Modelos Aminoácidos: 'blosum62', 'pam250', ...

calculator = DistanceCalculator('identity')
dm = calculator.get_distance(aln)

print(dm)


In [None]:
# Criar as árvores filogenéticas com os métodos UPGMA e NJ

C1 = DistanceTreeConstructor()
T1 = C1.upgma(dm)


C2 = DistanceTreeConstructor()
T2 = C2.nj(dm)






In [None]:
# Visualizar as árvores e analisar eventuais diferenças


Phylo.draw(T1, branch_labels=lambda c: f'{c.branch_length:.2f}' if c.branch_length else '')

Phylo.draw(T2, branch_labels=lambda c: f'{c.branch_length:.2f}' if c.branch_length else '')

