Skip to content

Trabajo Práctico para Introducción a Bioinformática en ITBA

Notifications You must be signed in to change notification settings

gibarsin/bioinformatics-tp1

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Resumen

Resolución de ejercicio 1 y 2 del TP Especial para la materia Introducción a la Bioinformática.

Requisitos

  • Java 10
  • Maven 3
  • Emboss [Ejercicio 5]

Cómo compilar el código

Para compilar el código correr en la línea de comandos sobre la raíz del proyecto:

mvn clean package

El programa bio.jar se encuentra en el directorio target generado en la compilación.

Cómo ejecutar el código

Para ejecutar el código, correr en la línea de comandos sobre la raíz del proyecto:

java -jar target/bio.jar <exercise> <arguments>

en donde <exercise> es el número de ejercicio y <arguments> son los argumentos dependiendo del ejercicio.

Cómo ejecutar cada ejercicio

Ejercicio 1) Ejecutar:

java -jar target/bio.jar 1 <genBankPath>

en donde es el path al archivo de tipo genbank. La salida se encontrará en el mismo directorio con el mismo nombre y extensión cambiada a .fas.

Ejercicio 2) Ejecutar:

java -jar target/bio.jar 2 <fastaPath> <isLocal>

en donde <fastaPath> es el path al archivo de tipo fasta que contiene la secuencia correcta de proteínas, de todas las secuencias obtenidas del ejercicio 1; <isLocal> es el booleano que decide si ejecuta la consulta sobre una base de datos local (opción no soportada actualmente) o sobre la base de datos púlica de BLAST. El resultado se guardará en un archivo con nombre blast.out en el mismo directorio que el archivo de entrada.

Ejercicio 4) En caso de querer preguntar por un pattern en particular, ejecutar:

java -jar target/bio.jar 4 <fastaPath> a <pattern>

En caso de querer consultar por todos los patterns únicos, ejecutar:

java -jar target/bio.jar 4 <fastaPath> b

Ejercicio 5) En la raíz del proyecto dirigirse al directorio Exercise5 que dentro contiene el script en bash Exercise5.sh. Ejecutar:

./Exercise5.sh <fastaPath>

en donde <fastaPath> es la secuencia de nucleótidos de la cuál se desea obtener los ORF y los dominios. La salida se encontrará en los archivos cuyo nombre es el mismo nombre que el del archivo pero con extensión .orf y .patmatmotifs.

About

Trabajo Práctico para Introducción a Bioinformática en ITBA

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages