Resolución de ejercicio 1 y 2 del TP Especial para la materia Introducción a la Bioinformática.
- Java 10
- Maven 3
- Emboss [Ejercicio 5]
Para compilar el código correr en la línea de comandos sobre la raíz del proyecto:
mvn clean package
El programa bio.jar se encuentra en el directorio target generado en la compilación.
Para ejecutar el código, correr en la línea de comandos sobre la raíz del proyecto:
java -jar target/bio.jar <exercise> <arguments>
en donde <exercise> es el número de ejercicio y <arguments> son los argumentos dependiendo del ejercicio.
Ejercicio 1) Ejecutar:
java -jar target/bio.jar 1 <genBankPath>
en donde es el path al archivo de tipo genbank. La salida se encontrará en el mismo directorio con el mismo nombre y extensión cambiada a .fas.
Ejercicio 2) Ejecutar:
java -jar target/bio.jar 2 <fastaPath> <isLocal>
en donde <fastaPath> es el path al archivo de tipo fasta que contiene la secuencia correcta de proteínas, de todas las secuencias obtenidas del ejercicio 1; <isLocal> es el booleano que decide si ejecuta la consulta sobre una base de datos local (opción no soportada actualmente) o sobre la base de datos púlica de BLAST. El resultado se guardará en un archivo con nombre blast.out en el mismo directorio que el archivo de entrada.
Ejercicio 4) En caso de querer preguntar por un pattern en particular, ejecutar:
java -jar target/bio.jar 4 <fastaPath> a <pattern>
En caso de querer consultar por todos los patterns únicos, ejecutar:
java -jar target/bio.jar 4 <fastaPath> b
Ejercicio 5)
En la raíz del proyecto dirigirse al directorio Exercise5
que dentro contiene el script en bash
Exercise5.sh
. Ejecutar:
./Exercise5.sh <fastaPath>
en donde <fastaPath> es la secuencia de nucleótidos de la cuál se desea obtener los ORF y los dominios. La salida se encontrará en los archivos cuyo nombre es el mismo nombre que el del archivo pero con extensión .orf y .patmatmotifs.