# Sesion 9: Lógica. Condicionales. Arreglos.

`Libro The Unix Workbench por Sean Kross, pg. 96 - 118`

- `true` : booleano para verdad 
- `false` : booleano para flasedad
- `$?` : variable de estado de salida (*exit status*)
- `&&` : operador lógico binario AND 
- `||` : operador lógico binario OR 
- if $ \cdots $ : inicio de una sentencia condicional
- fi : final de una sentencia condicional
- else $ \cdots $ : siguiente posible decisión condicional en una estructura *if*
- \[\[ $ \cdots $ \]\] : doble braces
- ( $ \cdots $ ) : declaración de arreglos
- `#` : longitud de un arreglo


## Estructuras de control condicional: `if` `else`

Los programas son capaces de ejecutar lógicas bastante complejas. La forma de hacerlo es concatenando **estructuras de control** o secuencias de control. Estas sentencias permiten controlar el flujo de ejecución de las instrucciones de un programa. La primera estructura que veremos son los condicionales. 

Los condicionales le permiten a un programa decidir en función de la veracidad de una sentencia lógica. Una sentencia lógica puede clasificarse en 2 tipos de acuerdo a su veracidad: *verdadera* o *falsa*. Por ejemplo, al procesar un archivo de secuencias, un script puede analizar de un conjunto de lecturas solo las que cumplan con un criterio de calidad o un script podría decidir si extraer secuencias con un patrón específico. Los tipos de datos que guardan el estado de verdad de una sentencia se llaman **booleanos**. 

En Bash, las variables booleanas se llaman `true` y `false`. Ambas se guardan en memoria como un `0` y un `1`, respectivamente. Esto se puede ver al imprimir la *variable de estado de salida* `$?`. 

In [None]:
true
echo $?
false
echo $?

Hay varios tipos de *estados de salida*. Uno importante es el `127`, que denota un error en el script. 

In [None]:
RSG_ECUADOR
echo $?

Es posible también concatenar variables lógicas y evaluar su veracidad a la vez. Por ejemplo, podríamos evaluar si la sentencia `E. coli es un animal procariota`. Hay dos proposiciones de verdad que evaluar: *si E. coli es animal* y *si E. coli es procariota*. Sabemos que la primera es `falsa` y la segunda es `verdadera`. Si juntamos ambas en una sola sentencia, claramente es `falsa`, porque *E. coli* no puede ser procariota `Y (AND)` animal a la vez. Instantáneamente al combinar una sentencia falsa con una verdadera, el conjunto es falso. Las 4 combinaciones posibles de sentencias son:

In [None]:
true && false
echo $?
false && true
echo $?
false && false
echo $?
true && true
echo $?

¡Hay solo 1 sentencia verdadera! El operador lógico para `AND` en Bash es `&&`. Es binario, por lo que concatena dos proposiciones lógicas a la vez. Por ejemplo, podemos hacer dos comparaciones de equivalencia y ver si ambas son verdad a la vez.

In [None]:
[[ 1 == 2 ]] && [[ 1 == 1 ]]
echo $?

Si repetimos el penúltimo escript con el operador `OR` `||`, veremos que los resultados son distintos. Ahora solo hay 1 sentencia falsa. En `OR` basta que uno de ambas propociciones comparadas sea verdad, para que el resultado sea también verdad. Entonces solo cuando hubiera dos false sería el resultado false. 

In [None]:
true || false
echo $?
false || true
echo $?
false || false
echo $?
true || true
echo $?

Podemos combinar `AND` y `OR`. ¿Qué resulta de estas sentencias? ¿Verdadero o falso?

In [None]:
true || false && true
echo $?

In [None]:
false || false && true
echo $?

In [None]:
true || false && false
echo $?

In [None]:
true || false && true || false
echo $?

Las expresiones condicionales utilizan precisamente este tipo de variables para analizar si agluna propocición es verdadera o falsa, y dependiendo del resultado, ejecutar o no una acción. Las `sentencias lógicas` se declaran utilizando doble corchete o `double braces`, y aceptan **operadores lógicos** como AND y OR, o también **flags lógicas**. Existen varios flags útiles en Bash `revisar página 104`.

In [None]:
# -gt : greater than
[[ 4 - 3 ]]
echo $?

In [None]:
[[ 4 -ge 3 ]]
echo $?

In [None]:
number=7
[[ $number -gt 3 ]] && echo t || echo f
[[ $number -gt 10 ]] && echo t || echo f
[[ -e $number ]] && echo t || echo f

Ahora veamos como funciona un script de Bash utilizando sentencias `if`

```bash
#!/usr/bin/env bash
# File: sif.sh
echo "Start program"
if [[ $1 -eq 4 ]]
then
    echo "You entered $1"
fi
echo "End program"
```

In [None]:
bash ./archivos/sif.sh 4

In [None]:
bash ./archivos/sif.sh 5

Ahora veamos cómo podemos aumentar las capas lógics al utilizar sentencias `if` anidadas, es decir, doble condición.

```bash
#!/usr/bin/env bash
# File: sif2.sh
if [[ $1 -gt 3 ]] && [[ $1 -lt 7 ]]
then
    if [[ $1 -eq 4 ]]
    then
        echo "four"
    elif [[ $1 -eq 5 ]]
    then
        echo "five"
    else
        echo "six"
    fi
else
    echo "You entered: $1, not what I was looking for."
fi
```

In [None]:
bash ./archivos/sif2.sh 2

In [None]:
bash ./archivos/sif2.sh 4

In [None]:
bash ./archivos/sif2.sh 100

In [None]:
a=1

In [None]:
[[ $a == 5 ]]
echo $?

Ahora vamos a usar este script en un archivo .sh. Los resultados, como se puede ver, son varios archivos `.txt`.
```bash
# Input de archivo
echo "Archivo a procesar > $@"
echo "Numero de argumentos: $#"

# Conteo de secuencias, separación de malas secuencias
numero_secuencias=$(grep -c '^@SRR098026' $@)
grep -B1 -A2 NNNNNNNNNN $@ > malas_lecturas.fastq
malas=$(cat malas_lecturas.fastq | wc -l)
echo "Número de malas lecturas: $malas"

# Búsqueda de patrones
echo "Desea buscar patrones (y/n): "
read d

if [[ $d == "y" ]]; then
    echo "Los patrones se guardarán en: patrones.txt"
    echo -e 'ACTG\nCCCCC\nNNNCNNN\nNNNGNNN\nTTTT\nTATA\nAAA' > patrones.txt
    grep -f patrones.txt $@ > busqueda.txt
    echo "Búsqueda de patrones guardada en: busqueda.txt"
else
    echo "ok :P"
fi

# Mensaje final
echo "Fin :)"
```

In [None]:
bash ./archivos/sesion7.sh ./archivos/secuencias3.fastq

## Arreglos

La información puede ser procesada de manera eficiente en **estructuras de datos**. Las esturcturas de datos son formas es una manera particular de organizar los datos. Puede ser tan compleja como sea necesaria. Varios algoritmos requieren el diseño de estructuras de datos diseñadas con particularidades para facilitar el procesamiento de dato. La primera estructura de datos se deriva del *álgebra lineal*, específicamente de las **tuplas**. Una *n-tupla* es una lista finita con *n* elementos ordenados. Abajo tenemos una tupla llamada $ \textbf{x} $. El conteo empieza desde 0, hasta *n-1*.

$$ \textbf{x} = (x_0, x_1, x_2, \ldots, x_{n-1}) $$

Otros objetos matemáticos similares son los vectores y las matrices. Las tuplas se pueden operar con ciertas reglas algebráicas, e inspiraron varios tipos de estructuras de datos similares en computación. El primero que vamos a aprender son los **arreglos unidimensionales**. Estos contenedores se declaran con paréntesis `()` y cada elemento va separado por espacios, no por comas, como en una tupla. Podemos acceder a cada elmento

In [None]:
plagues=(blood frogs lice flies sickness boils hail locusts darkness death)
echo ${plagues[0]}
echo ${plagues[1]}
echo ${plagues[2]}
echo ${plagues[*]}

También podemos actualizar los valores

In [None]:
# sickness por disease
echo ${plagues[*]}
plagues[4]=disease
echo ${plagues[*]}

Podemos declarar subconjuntos de el mismo arreglo.

In [None]:
echo ${plagues[*]:5:3}

O encontrar la cantidad de elementos de una arreglo con el operador `#`.

In [None]:
echo ${#plagues[*]}

Si intentamos utilizar más de los elementos que posee el arreglo, entonces busca fuera del arreglo o no retorna nada.

In [None]:
echo ${plagues[10]}

In [None]:
echo ${plagues[9]}

Y podemos usar el operador `+=` para concatenar dos arreglos.

In [None]:
dwarfs=(grumpy sleepy sneezy doc)
echo ${dwarfs[*]}
dwarfs+=(bashful dopey happy)
echo ${dwarfs[*]}