# Tutorial práctico de bash
Al interior de la comunidad de data science existe un debate interminable sobre la conveniencia de trabajar con las dos grandes familias de sistemas operativos: Windows y GNU/Linux. En mi experiencia personal, tener working knowledge de GNU/Linux es ** indispensable ** por varias razones:

1. Los sistemas GNU/Linux cuentan con comunidades vibrantes que los desarrollan, mantienen y expanden.
2. El 99% de los servidores del mundo corren sobre alguna variante de GNU/Linux.
3. Los sistemas distribuidos de más amplio uso estan diseñados para correr sobre variantes de GNU/Linux.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/0/0d/Operating_systems_used_on_top_500_supercomputers.svg/1200px-Operating_systems_used_on_top_500_supercomputers.svg.png" alt="terminal" style="width:750px;"/>

Bash (Bourne-again shell) es la interfaz de usuario de linea de comando más utilizada en la mayoría de los sistemas operativos Unix-like incluídos GNU/Linux y Mac OSx. Mediante Bash y su lenguaje de comandos se puede interactuar con el sistema operativo para realizar operaciones como:

* Explorar el sistema de archivos.
* Renombrar, mover y copiar archivos y directorios de manera local o remota.
* Instalar, configurar y ejecutar programas y aplicaciones. 
* Controlar servidores de manera remota. 

### La terminal y el sistema de archivos

Abra el emulador de terminal en su máquina virtual.

<img src="https://www.wikihow.com/images/thumb/6/6b/Create-and-Edit-Text-File-in-Linux-by-Using-Terminal-Step-1-Version-3.jpg/aid4019578-v4-728px-Create-and-Edit-Text-File-in-Linux-by-Using-Terminal-Step-1-Version-3.jpg" alt="terminal" style="width:250px;"/>

<img src="https://i.stack.imgur.com/RODdm.jpg" alt="terminal" style="width:250px;"/>

El texto que antecede al símbolo $ en la terminal se conoce como el command prompt y contiene información valiosa. Identifica al usuario, la máquina y el directorio de trabajo actual. En todos los sistemas Unix-like el símbolo ~ identifica el home del usuario (en su caso es ```/home/usuariomlandpp```).  

```console
usuariomlandpp@ubuntuvm:~$ whoami 
```

El sistema de archivos puede pensarse como una estructura arborea con las siguientes características:

* Hay dos tipos de nodos en la estructura: archivos y directorios.
* Los directorios pueden referenciar archivos o a otros directorios.
* Los archivos son nodos terminales y no pueden referenciar a ningún nodo. 
* Todos los nodos tienen exactamente un padre.
* Todos los directorios contienen una referencia a si mismos denotada por el símbolo "." y otra referencia a su padre denotada por el símbolo "..".
* Todos las referencias están etiquetadas con un nombre. La ruta de un nodo a otro nodo se especifica mediante la concatenación de nombres de referencias con el caracter "/". Note que todos los nodos tienen una ruta absoluta (desde el nodo raiz), y muchas rutas relativas! 
* El nodo raíz se denota con el símbolo "/".

Instale el siguiente paquete para explorar visualmente el sistema de archivos de la máquina virutal:

```console
usuariomlandpp@ubuntuvm:~$ tree 
```

```console
usuariomlandpp@ubuntuvm:~$ sudo apt-get install tree 
```

Para explorar el sistema de archivos de su máquina virtual ejecute los siguientes comandos:

```console
usuariomlandpp@ubuntvmu:~$ tree
```

```console
usuariomlandpp@ubuntvmu:~$ tree / -L 1
```

```console
usuariomlandpp@ubuntuvm:~$ tree /var/log -L 3
```

```console
usuariomlandpp@ubuntuvm:~$ tree /home
```

```console
usuariomlandpp@ubuntuvm:~$ tree /home/usuariomlandpp
```

Los siguientes comandos son útiles para navegar el sistema de archivos:

* ```ls [ruta]``` lista el contenido de la ruta especificada como argumento.
* ```cd [ruta]``` establece la ruta especificada como argumento como directorio de trabajo actual.
* ```pwd``` imprime el directorio de trabajo actual.

Los siguientes comandos son útiles para modificar el sistema de archivos:

* ```mkdir [ruta]``` crea un directorio en la ruta especificada.
* ```cp [ruta origen,ruta destino]``` copia un archivo o directorio de la ruta origen a la ruta destino.
* ```mv [ruta origen,ruta destino]``` mueve un archivo o directorio de la ruta origen a la ruta destino.
* ```rm [ruta]``` elimina el archivo o directorio especificado por ruta. 

Para acceder a la documentación completa de cualquier comando utilice el comando ```man [comando]```. Por ejemplo:

```console
usuariomlandpp@ubuntuvm:~$ man ls
```

### Ejercicio 1:

* Cree un directorio de nombre ```datos``` en su home. Copie el archivo ```suficiencia.csv``` a ese directorio. 
* Especifique cual es la ruta absoluta del archivo que acaba de copiar.
* Especifique cual es la ruta relativa del archivo que acaba de copiar, desde /var/log.

### Trabajando con archivos:
A partir de este momento se asumirá que el pwd es ```/home/mlandpp```. Es decir, todas las rutas que no comiencen por  ```/``` seran relativas a ese directorio. El archivo ```datos/suficiencia.csv``` contiene información sobre una muestra de 100,000 afiliados al régimen contributivo del Sistema General de Salud y Seguridad Social (SGSSS) en el 2010 y el 2011. 

Los siguientes comandos básicos son útiles para explorar archivos:

* ```cat [ruta]``` imprime en pantalla el archivo especificado por ruta.
* ```head [ruta]``` imprime en pantalla las primeras lineas del archivo especificado por ruta.
* ```tail [ruta]``` imprime en pantalla las últimas lineas del archivo especificado por ruta.
* ```wc [ruta]``` cuenta el número de lineas en el archivo especificado por ruta.

```console
usuariomlandpp@ubuntuvm:~$ cat datos/suficiencia.csv
```

```console
usuariomlandpp@ubuntuvm:~$ head datos/suficiencia.csv
```

```console
usuariomlandpp@ubuntuvm:~$ head -n 20 datos/suficiencia.csv
```

```console
usuariomlandpp@ubuntuvm:~$ tail datos/suficiencia.csv
```

```console
usuariomlandpp@ubuntuvm:~$ tail -n datos/suficiencia.csv
```

```console
usuariomlandpp@ubuntuvm:~$ wc -l datos/suficiencia.csv
```

El operador ```>>``` permite redireccionar el contenido a imprimir en pantalla a un archivo. Ejecute los siguientes comandos:

```console
usuariomlandpp@ubuntuvm:~$ head -n 20 datos/suficiencia.csv >> datos/suficiencia_primeras20.csv
```

```console
usuariomlandpp@ubuntuvm:~$ wc -l datos/suficiencia_primeras20.csv
```

El operador ```|``` permite redireccionar el contenido a un nuevo comando. Por ejemplo:

```console
usuariomlandpp@ubuntuvm:~$ head -n 20 datos/suficiencia.csv | wc -l
```

Note que el resultado es el mismo que si se hubiese utilizado un archivo temporal intermedio utilizando el operador ```>>``` como en el ejemplo anterior. Borre el archivo temporal que creo para mantener el directorio de trabajo limpio:

```console
usuariomlandpp@ubuntuvm:~$ rm datos/suficiencia_primeras20.csv
```

Algunos comandos más avanzados para explorar archivos son:

* ```cut``` permite seleccionar columnas de un archivo.
* ```grep``` permite realizar búsquedas sobre las filas de un archivo.
* ```sort``` permite ordenar las filas de un archivo. 

```console
usuariomlandpp@ubuntuvm:~$ cut -d ',' -f 14 datos/suficiencia.csv | head
```

```console
usuariomlandpp@ubuntuvm:~$ grep '0000-00000-00000-0000' datos/suficiencia.csv
```

```console
usuariomlandpp@ubuntuvm:~$ grep -v '0000-00000-00000-0000' datos/suficiencia.csv
```

```console
usuariomlandpp@ubuntuvm:~$ cut -d ',' -f 1,14 datos/suficiencia.csv | sort -n -t ',' 
```

### Ejercicio 2
La columna 'EPS_2010' (índice 8) indica la EPS del afiliado en el 2010. La columna 'VALOR_TOT_2010' (índice 13) indica el gasto del afiliado en el 2010. A partir de esto:

* Encuentre el número de afiliados a la EPS 038 en el 2010 e imprimalo en pantalla. 

* Encuentre el número de afiliados a la EPS 010 en el 2010 e imprimalo en pantalla. 

* Encuentre el máximo sobre el gasto de los afiliados a la EPS 010 en el 2010 y guárdelo en un archivo con ruta ```datos/max_gasto_eps010
.csv```.

* Encuentre el mínimo sobre el gasto de los afiliados a la EPS 010 en el 2010 y guárdelo en un archivo con ruta ```datos/min_gasto_eps010.csv```.

* Encuentre la mediana sobre el gasto de los afiliados a la EPS 010 en el 2010. 

Los resultados deberían ser los siguientes:

```console
6
7436
212348367
30
141289.5
```

### Trabajando con scripts
Un script de bash es un archivo de texto plano que contiene una secuencias de comandos de bash especificados linea a linea. El comportamiento de los comandos ejecutados directamente en bash o en un script es exactamente el mismo. Para ejecutar un script se debe especificar el binario de bash (típicamente ```/bin/bash```) o simplemente ```./```:

```console
usuariomlandpp@ubuntuvm:~$ echo 'echo Hola Mundo!' >> script.sh
```

```console
usuariomlandpp@ubuntuvm:~$ echo 'echo Chao Mundo!' >> script.sh
```

```console
usuariomlandpp@ubuntuvm:~$ chmod +x script.sh
```


```console
usuariomlandpp@ubuntuvm:~$ ./script.sh
```