Programación del Terminal
==========================================

* *120 min* | Última modificación: Diciembre 17, 2019.

Variables y arrays
--

Las variables en Bash funcionan de forma análoga a las variables en otros lenguajes de programación.  

Las variables en Bash no necesitan ser declaradas (tal como en el lenguaje C) para ser usadas. Para hacer la asignación se utiliza el símbolo `=`; note que no puede haber espacio alrededor del `=`. En la segunda línea de código es necesario preceder el nombre de la variable por `$` para indicar que var1 es un nombre de variable y no una cadena de texto.

In [1]:
%%bash
var1='hola mundo'
echo $var1 

hola mundo


In [2]:
%%bash
echo var1

var1


A una variable se le puede asignar el resultado de un comando:

In [3]:
%%bash
x=$(echo hola mundo)
echo $x

hola mundo


El shell solo soporta aritmética entera y está diseñado primariamente para operaciones del sistema operativo y cadenas de caracteres, por lo que en el siguiente código lo que se indica es que se están concatenando cadenas de caracteres.

In [4]:
%%bash
x=1
y=$x+1
echo $y

1+1


Para indicar que se están realizando operaciones aritméticas hay dos opciones: la primera es utilizar el operador `$((` ... `))`  y la segunda es usar el comando `let`.

In [5]:
%%bash
x=1
y=$((x+1))
echo $y

2


In [6]:
%%bash
let x=1
let y=x+1
echo $y

2


El shell soporta los `+=`, `-=`, ... similares a los del lenguaje C. No pueden dejarse espacios alrededor de ellos.

In [7]:
%%bash
let x=1
let x+=1
echo $x

2


Bash también permite el uso de arrays. Para crear un array es necesario colocar sus componentes entre `(` y `)`. Note que cuando se imprime con `echo` solo aparece el primer elemento.

In [8]:
%%bash
x=(a b c d e)
echo $x

a


Para acceder a cada uno de los elementos se debe usar el operador `[` ... `]`, teniendo en cuenta que el primer elemento tiene índice cero, el segundo índice uno y así sucesivamente.

In [9]:
%%bash
x=(a b c d e)
echo ${x[1]}

b


Para imprimir todos los elementos se debe usar `[*]`.

In [10]:
%%bash
x=(a b c d e)
echo ${x[*]}

a b c d e


Se pueden usar las estructuras de iteración anteriores para recorrer los elementos del vector.

In [11]:
%%bash
x=(a b c d e)
for n in ${x[*]}
do
    echo $n
done

a
b
c
d
e


Los elementos del vector también pueden ser modificados.

In [12]:
%%bash
x=(a b c d e)
x[2]='hola'
for n in ${x[*]}
do
    echo $n
done

a
b
hola
d
e


Scripts
--

Los scripts son archivos que contienen secuencias de comandos y que pueden ser ejecutados directamente en la línea de comandos (Bash en este caso). En el siguiente ejemplo, se va a crear un script llamado `demo.sh` el cual imprime `hola mundo` en la pantalla. 

Se direcciona la salida al archivo en vez de la pantalla.

In [13]:
%%bash
echo 'echo hola mundo' > demo.sh  

Se imprime en pantalla el contenido de demo.sh

In [14]:
%%bash
cat demo.sh  

echo hola mundo


El archivo fue creado en el directorio de trabajo

In [15]:
!ls *.sh  

demo.sh


Para ejecutarlo se usa el comando `bash`.

In [16]:
!bash ./demo.sh  

hola mundo


Es posible hacer que el archivo `demo.sh`  sea ejecutable por el sistema operativo. 

En primer lugar, es necesario agregar la linea: 

    #! /usr/bin/env bash 
    
la cual indica que el archivo actual puede ser ejecutado usando el comando `bash`; obligatoriamente esta tiene que ser la primera línea del archivo.  La cadena de caracteres `#!` se conoce como *shebang*, *hashbang* o *sharpbang* en la jerga de Unix; después del shebang va el `path` donde se encuentra el programa que puede ejecutar el archivo actual; y finalmente, aparece el nombre del programa como tal.       

In [17]:
%%bash
cat > demo <<EOF
#! /usr/bin/env bash
echo hola mundo
EOF

Se imprime el contenido de `demo.sh`.

In [18]:
!cat demo

#! /usr/bin/env bash
echo hola mundo


En segundo lugar, se modifican las propiedades del archivo `demo.sh` con el comando `chmod` para hacerlo ejecutable (opción `+x`).

In [19]:
!chmod +x demo

Para ejecutar `demo.sh` es necesario precederlo de `./` para indicar que el archivo se encuentra en el directorio actual de trabajo.

In [20]:
%%bash
./demo

hola mundo


La ventaja de los scripts es que pueden ser usados pasándoles parámetros.

En este caso se modifica el programa anterior para que salude al usuario, cuyo nombre se pasa como un parámetro al script. `$1` corresponde al primer argumento de la llamada.

In [21]:
%%bash
cat > demo.sh <<EOF
#! /usr/bin/env bash
echo hola \$1 \$2
EOF

In [22]:
!cat demo.sh

#! /usr/bin/env bash
echo hola $1 $2


In [23]:
!chmod +x demo.sh

In [24]:
%%bash
./demo.sh juan david

hola juan david


Como se observó en el ejemplo anterior: 
* `$1` indica el primer argumento. 
* `$2` indica el segundo argumento, y así sucesivamente. 
* `$0` es el nombre del script. 
* `$*` y `$@` representan la cadena de texto conformada por todos los argumentos. 
* `$#` indica el número de argumentos pasados al script. 

In [25]:
%%bash
echo "echo \$@
echo \$*
echo \$0
echo \$1
echo \$#" > demo.sh
cat demo.sh

echo $@
echo $*
echo $0
echo $1
echo $#


In [26]:
!bash demo.sh a b c d

a b c d
a b c d
demo.sh
a
4


Funciones
--

En el siguiente ejemplo se crea una función en Bash. Después del nombre de la función siempre se escribe `()` y se delimita el cuerpo de la función usando llaves (`{`  y `}`).

In [27]:
%%bash
demo(){
  echo hola mundo
}

Para ejecutar la función simplemente se escribe su nombre (sin `()`).

In [28]:
%%bash
demo(){
  echo hola mundo
}
demo

hola mundo


Los argumentos se notan como `$1`... al igual que en los scripts. En este caso `$0` es el `bash` y no se puede acceder al nombre de la función. Note que en la llamada a la función no se usan paréntesis, tal como si ocurre en otros lenguajes de programación.

In [29]:
%%bash
demo() {
  echo $@
  echo $*
  echo $0
  echo $1
  echo $#
}
demo a b c d

a b c d
a b c d
bash
a
4


Las funciones pueden ser almacenadas y ejecutadas dentro de un script, tal como se muestra a continuación.

In [30]:
%%bash
cat > maxmin.sh <<EOF 
min2(){
    echo 'arg1 (min2): ' \$1
    echo 'arg2 (min2): ' \$2
    if ((\$1 < \$2))
    then 
        echo \$1
    else
        echo \$2
    fi        
}

max2(){
    echo 'arg1 (max2): ' \$1
    echo 'arg2 (max2): ' \$2
    if ((\$1 > \$2))
    then 
        echo \$1
    else
        echo \$2
    fi        
}

max2 \$3 \$4
min2 \$1 \$2
EOF

In [31]:
%%bash
bash maxmin.sh 10 20 30 40

arg1 (max2):  30
arg2 (max2):  40
40
arg1 (min2):  10
arg2 (min2):  20
10


Decisión con if-then-else-fi y case-esac
--

En el siguiente ejemplo se codifica la función `min2` la cual recibe dos números enteros e imprime el menor de ellos. Si ambos números son iguales, se imprimen ambos argumentos. En este ejemplo también se presenta la estructura condicional `if`; para que el condicional sea evaluado correctamente es necesario colocar la expresión entre `((` y `))`. 

In [32]:
%%bash
min2(){
    if (($1 < $2))
    then 
        echo $1
    elif (($1 == $2))
    then
        echo $1 $2
    else
        echo $2
    fi        
}
min2 1 2

1


El siguiente codigo lee los nombres de los archivos del directorio actual e imprime los que son un jupyter notebook. En la primera línea, `*` indica los archivos y directorios en el directorio actual de trabajo.  En la cuarta línea, `*.ipynb` indica que el nombre de archivo (almacenado en `x`) debe terminar en la extensión `.ipynb`. La expresión `*)` en la quinta línea es el caso por defecto (cualquier nombre de archivo), es decir, se ejecuta si no han cumplido ninguna de las instrucciones especificadas por las sentencias `case` anteriores.

In [33]:
%%bash
for x in *
do
    case $x in
        *.ipynb) echo -n -e $x ' es un Jupyter notebook\n';;
        *) 
    esac
done

1-02-gestion-de-archivos-y-directorios.ipynb  es un Jupyter notebook
1-04-actividad-creacion-y-edicion-de-archivos-de-texto.ipynb  es un Jupyter notebook
2-05-comandos-basicos-datos.ipynb  es un Jupyter notebook
3-07-uso-interactivo-del-terminal.ipynb  es un Jupyter notebook
3-08-edicion-de-archivos-con-sed.ipynb  es un Jupyter notebook
3-09-edicion-de-archivos-con-awk.ipynb  es un Jupyter notebook
3-10-edicion-de-archivos-con-perl.ipynb  es un Jupyter notebook
4-11-ejecucion-de-consultas-sql-en-bash.ipynb  es un Jupyter notebook
5-13-app-interactiva.ipynb  es un Jupyter notebook
5-14-programacion-del-terminal.ipynb  es un Jupyter notebook


Ciclos definidos con for
--

A continuación se presentan varios ejemplos de procesos iterativos usando `for`.

In [34]:
%%bash
# imprime los números del 1 al 5.
for x in 1 2 3 4 5  
do
    echo -n $x ''
done

1 2 3 4 5 

In [35]:
%%bash
# el mismo ejemplo anterior.
for x in $(seq 1 5) 
do
    echo -n $x ''
done

1 2 3 4 5 

In [36]:
%%bash
# de nuevo, el mismo ejemplo anterior
for x in {1..5} 
do
    echo -n $x ''
done

1 2 3 4 5 

In [37]:
%%bash
# note que la expresión va entre '(('  y '))'
for ((x=1; x <= 5; x++))  
do
  echo -n $x ''
done

1 2 3 4 5 

En el siguiente ejemplo se generarán las cadenas de texto `file1.txt`, `file2.txt` ... hasta `file5.txt` usando un ciclo `for`. El nombre de la variable debe encerrarse entre `${` y `}` para distinguirlo del resto de la cadena de texto. Es decir, si se coloca `echo filex.txt` o `echo file$x.txt` el intérprete no puede diferenciar el nombre de la variable (`x`) del texto restante.

In [38]:
%%bash
for x in {1..5} 
do
    echo file${x}.txt
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


De hecho, se pueden generar salidas mucho más complejas, tal como se ilustra a continuación (Ok! no se necesita el for para esto, pero es para ejemplificar).

In [39]:
%%bash
# el for recibe el resultado de ejecutar la expresión entre '$('  y  ')'.
for x in $(seq -f'file%g.txt' 5) 
do
    echo '--->' $x
done

---> file1.txt
---> file2.txt
---> file3.txt
---> file4.txt
---> file5.txt


En el siguiente ejemplo se genera un conjunto de archivos llamados `out.1`, `out.2`, ..., `out.5`. 

In [40]:
%%bash
for x in {1..5}
do
    seq -f'linea %g' 5 > out.${x}
done
ls out.*

out.1
out.2
out.3
out.4
out.5


A continuación se usa el comando `head` para iterar sobre los archivos e imprimir la primera línea de cada uno de ellos.

In [41]:
%%bash
head1(){
    for x in out.*
    do
        head -n 1 $x
    done
}
head1

linea 1
linea 1
linea 1
linea 1
linea 1


Ciclos condicionales con while
--

El último ejemplo puede ser realizado usando un ciclo `while` en vez de un ciclo `for`. En este caso, el condicional puede ser especificado con la palabra clave `test` o colocando el condicional entre `((` y `))`.  

In [42]:
%%bash
n=1
while test $n -le 5
do
    echo file${n}.txt
    n=$((n+1))
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


In [43]:
%%bash
n=1
while (($n <= 5))
do
    echo file${n}.txt
    n=$((n+1))
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


Ciclos condicionales con until
--

Otra forma alternativa es usar un ciclo `until`.

In [44]:
%%bash
n=1
until (($n > 5))
do
    echo file${n}.txt
    n=$((n+1))
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


En el último ejemplo de esta sección, se codifica una función que recibe una lista de enteros e imprime el menor de ellos.

In [45]:
%%bash
minimum(){
    n=$1
    for x in $*
    do
        if test $x -lt $n 
        then
            n=$x
        fi
    done
    echo $n
}
minimum 6 1 7 5 1 2  5

1


Implementación de herramientas escritas en otros lenguajes   
--

Una de las características primordiales del sistema operativo Unix es que los comandos como cat y ls, realmente son programas (almacenados en archivos) que existen en el disco duro del computador y el interprete de comandos los ejecuta en respuesta a las acciones del usuario. Cada uno de estos programas puede estar escrito en un lenguaje de programación y el interprete permite que se ejecuten de una forma transparente. Consecuentemente, la utilidad de la línea de comandos radica en la posibilidad de crear nuevas herramientas con el lenguaje de programación que sea más ventajoso para cada tarea particular, y combinarlas con las herramientas existentes.  

Herramientas en Python
--

Como primer ejemplo, se escribirá una herramienta `seq.py` en el lenguaje Python, la cual  recibe como parámetro un entero `n` e imprima la secuencia de `1` hasta `n`. Si se desea una herramientas que funcione de forma similar a los comandos del sistema operativo se obviaría la extensión del archivo. 

El primer paso es ubicar el directorio de instalación de Python usando el comando `which`.

In [46]:
!which -a python3

/usr/bin/python3


El resultado anterior indica que hay una instalación de Python en la VM en el directorio `/usr/bin/python`. Para determinar que versión de Python se encuentra instalada se llama el interprete con la opción `--version`. 

In [47]:
!/usr/bin/python3 --version

Python 3.6.9


Esto indica que está instalada la versión 2.7.15rc1. Sin embargo, en Ubuntu, el interprete de Python 3 es `python3`: 

In [48]:
!which -a python3

/usr/bin/python3


In [49]:
!python3 --version

Python 3.6.9


En la siguiente porción de código se escribe la herramienta `seq.py`.

In [50]:
%%bash
cat > seq.py <<EOF
import sys
x = int(sys.argv[1])
for i in range(x):
    print (i+1) 
EOF

La sentencia `import sys` indica que se debe cargar la librería con las funciones del sistema. La variable `sys.argv`  es una lista que contiene los argumentos de la llamada; `sys.argv[0]` es el nombre del programa (`seq.py`) y `sys.argv[1]` es el entero `n`.

Para ejecutarla es invoca el interprete de Python ubicado en el directorio `/usr/bin/python`.

In [51]:
!/usr/bin/python3 seq.py 5

1
2
3
4
5


Para comvertir el programa anterior en una herramienta del sistema operativo, se adiciona el shebang (`#!`) y se cambian las propiedades del archivo para hacerlo ejecutable usando `chmod`. 

In [52]:
%%bash
cat > seq.py <<EOF
#! /usr/bin/python3
import sys
x = int(sys.argv[1])
for i in range(x):
    print (i+1)
    
EOF

In [53]:
!chmod +x seq.py

Para ejecutar el programa ya no es necesario invocar el interprete de Python.

In [54]:
!./seq.py 4

1
2
3
4


Herramientas en R (deprecated)
--

También es posible escribir herramientas en R. En este ejemplo se escribirá una herramienta que genere una secuencia de números aleatorios. En primer lugar (al igual que en el caso anterior), se obtiene la ubicación del interprete del lenguaje R para la consola de comandos.

In [55]:
!which -a Rscript

Seguidamente, se escribe el código en R en el archivo `unif.R` y se cambian las propiedades del archivo para hacerlo ejecutable usando `chmod`.

In [56]:
%%sh
cat > unif.R <<-FILE
#! /usr/bin/env Rscript
args <- commandArgs(trailingOnly=TRUE)  
cat(runif(as.numeric(args)), sep='\n')  
FILE

In [57]:
!chmod +x unif.R

En este caso, y de forma similar al programa escrito en Python, args es una variable que almacena los argumentos con que se llama el programa `unif.R`. 

En este punto ya es posible usar la herramienta para generar secuencias de números aleatorios uniformemente distribuidos.

In [58]:
!./unif.R 5

/usr/bin/env: 'Rscript': No such file or directory


La potencia de la línea de comandos radica en que el Bash actua como un pegante que permite usar las herramientas escritas en distintos lenguajes. Como siguiente ejemplo, se desea escribir una función en `bash` llamada `randunif` que genere `n` archivos llamados `out.*` los cuales contienen `m` números aleatorios uniformes. Por ejemplo, la llamada `randunif 2 4` genera 2 archivos con 4 números aletorios cada uno. La función `randunif` es codificada en `bash`:

In [59]:
%%bash
randunif(){
    for n in $(seq $1)
    do
        echo $(./unif.R $2) > aux.${n}
        tr ' '  '\n' < aux.${n} > out.${n}
        rm aux.${n}  
    done
}

A continuación se generan los archivos `out.1`, `out.2` y `out.3` con 5 números aleatorios cada uno:

In [60]:
!randunif 3 5

/bin/sh: 1: randunif: not found


In [61]:
!cat out.1

linea 1
linea 2
linea 3
linea 4
linea 5


In [62]:
!cat out.2

linea 1
linea 2
linea 3
linea 4
linea 5


In [63]:
!cat out.3

linea 1
linea 2
linea 3
linea 4
linea 5


**Limpieza del directorio de trabajo.**

In [64]:
%%sh
rm *.sh
rm out*
rm *.py
rm *.R
rm demo*