El presente repositorio tiene como finalidad hostear los ejercicios que se desarrollaron para el trabajo semestral de la asignatura de Bioinformática del Instituto Tecnológico de Buenos Aires. El objetivo principal del trabajo es utilizar herramientas bioinformáticas para el análisis de enfermedades genéticas en la población humana.
El flujo de trabajo consiste en seleccionar un archivo en formato GenBank (.gb), depositarlo en la carpeta input sobre el que se realizarán:
- Traducción desde secuencia nucleotídica a peptídica
- Búsqueda mediante BLAST en Swissprot, tanto de forma local como remota
- Construcción de un alineamiento múltiple de secuencias, utilizando MUSCLE
- Análisis de motivos consultando Prosite de manera local, mediante la herramienta patmatmotifs de EMBOSS
- Construcción de primers en base a parámetros configurables desde la carpeta config
Los resultados de ejecutar cada paso se guardarán en una carpeta denominada output, que se crea automáticamente si no existe. Para una descripción más detallada de lo desarrollado en cada inciso, consultar los archivos .md en la carpeta de source.
El código fue desarrollado enteramente dentro de Ubuntu 20.04. Para poder correr el flujo de trabajo, se necesita contar con un entorno capaz de ejecutar bash, y las siguientes herramientas instaladas y correctamente configuradas:
- Comandos nativos de muchos sistemas operativos basados en Linux: wget y gunzip
- Python 3.10, junto con la librería de BioPython.
- MUSCLE, BLAST y EMBOSS
Para prepar las búsquedas locales y descargar la base de datos de Prosite se necesita contar con conexión a internet. Para configurar Prosite, se requiere otorgar permisos de administrador, ya que prosextract de EMBOSS modifica archivos en carpetas protegidas.
Una vez configurado el entorno de trabajo y habiendo clonado el repositorio, ejecutar main desde la carpeta donde se ubica todo el repositorio, no en source.
Agustín Luna Simondi |
Sofía Bouzo |
Sebastian Wøhlk |
Josue F. Laszeski |
Queremos dar especial reconocimiento a la cátedra de la asignatura, por su constante apoyo en la resolución de los distintos ejercicios y su continua disponibilidad para resolver nuestras inquietudes.