Repositorio para os codigos da cadeira Biologia Computacional cursada no segundo semestre de 2019 ministrada pelo professor Marcio Dorn na Universidade Federal do Rio Grande do Sul (UFRGS).
- Python (acho que tanto faz se é 2 ou 3)
- Numpy
- Pandas (somente para os scripts da lista 4)
Manipulacao de strings representando sequencias de cromossomos.
Implementacao do metodo Needleman-Wunsch de alinhamento aplicado a sequencias de proteinas. Utilisacao da matriz BLOSUM (BLOcks of Amino Acid Substitution Matrix) 62.
Implementacao do metodo de Smith-Waterman de alinhamento de sequencias.
Construção de árvores filogenéticas. Implementação do método aglomerativo para árvores ultrametricas UPGMA (unweighted pair group method with arithmetic mean). Aplicação do UPGMA a uma matriz de distância genética entre as espécies Gorila, Orangotango, Humano, Chimpanzé, e Gibão.
Construção de árvores filogenéticas. Implementação do método aglomerativo para inferencia de arvores filogeneticas Neighbour Joining. Aplicação do Neighbour Joining a uma matriz de distância genética entre as espécies Gorila, Orangotango, Humano, Chimpanzé, e Gibão.
Análise de dados de microarray e técnicas de clusterização. Implementação do método K-Means. Aplicação do K-Means numa base de dados com 72 amostras de microarray com expressão de 7129 genes. Comparação dos resultados do K-Means com os rótulos das amostras (ALL ou AML).
Análise de dados de microarray com K-Means (implementado na parte 1) para clusterização. Implementacao de um algoritmo genético para seleção de features: selecao dos genes que importam para determinar se uma amostra de microarray corresponde a um cancer do tipo ALL ou AML. Plot de um grafico para visualizar a convergencia do algoritmo genetico.