# Transformación de Datos usando Bash -- 3
Notas de clase sobre la transformacion de datos usando la línea de comandos en sistemas Linux

**Juan David Velásquez Henao**    
jdvelasq@unal.edu.co  
Universidad Nacional de Colombia, Sede Medellín  
Facultad de Minas  
Medellín, Colombia  

[Licencia](https://github.com/jdvelasq/transformacion-datos-bash/blob/master/LICENCIA.txt)  
[Readme](https://github.com/jdvelasq/transformacion-datos-bash/blob/master/readme.md)

**Software utilizado**.

> Este es un documento interactivo escrito como un notebook de [Jupyter](http://jupyter.org), en el cual se presenta un tutorial sobre la transformación de datos usando Bash en el contexto de la ciencia de los datos. Los notebooks de Jupyter permiten incoporar simultáneamente código, texto, gráficos y ecuaciones. El código presentado en este notebook puede ejecutarse en los sistemas operativos Linux y OS X.

> Haga click [aquí](https://github.com/jdvelasq/guias-de-instalacion) para obtener instrucciones detalladas sobre como instalar Jupyter en Windows y Mac OS X.

> Haga clic [aquí](http://nbviewer.jupyter.org/github/jdvelasq/transformacion-datos-bash/blob/master/transformacion-datos-bash-3.ipynb) para ver la última versión de este documento en nbviewer.

> Descargue la última versión de este documento a su disco duro; luego, carguelo y ejecutelo en línea en [Try Jupyter!](https://try.jupyter.org)

#### Contenido

>   * [Variables y arrays](#Variables-y-arrays)
  * [Scripts](#Scripts)
  * [Funciones](#Funciones)
  * [Estructuras de control](#Estructuras-de-control)
    * [Decisión con `if-then-else-fi` y `case-esac`](#Decisión-con-if-then-else-fi-y-case-esac)
    * [Ciclos definidos con `for`](#Ciclos-definidos-con-for)
    * [Ciclos condicionales con `while` ](#Ciclos-condicionales-con-while)
    * [Ciclos condicionales con `until`](#Ciclos-condicionales-con-until)
  * [Cálculos numéricos en punto flotante](#Cálculos-numéricos-en-punto-flotante)
  * [Implementación de herramientas escritas en otros lenguajes   ](#Implementación-de-herramientas-escritas-en-otros-lenguajes)
    * [Herramientas en Python](#Herramientas-en-Python)
    * [Herramientas en R](#Herramientas-en-R)

**Bibliografía**.

> [1] D. Cross. Data Munging with Perl. Maning Publications Co. 2001

> [2] S. Redmond. Mastering QlikView. Packs Publishing, 2014.

> [3] T. Meyr. Apple® Automator with AppleScript® Bible. Wiley Publishing, Inc., Indianapolis, Indiana, 2010.

> [4] C. Albing, JP Vossen and C. Newham. Bash cookbook. O'Reilly, Media Inc. 2007. 

> [5] E. S. Raymond, The Art of Unix Programming. Addison-Wesley, 2004.

> [6] K. McElhearn. The Mac OS X Command Line: Unix under the hood. Ibex, 2005.

> [7] R. K. Michael. Mastering Unix Shell Scripting. Wiley, 2003.

**Recursos adicionales de aprendizaje**

> [The Command Line Crash Course](http://cli.learncodethehardway.org/book/) 

> [The Linux Command Line](http://linuxcommand.org/tlcl.php) By William Shotts

> [Learn Enough Command Line to Be Dangerous](https://www.learnenough.com/command-line-tutorial#sec-grepping) by Michael Hart

> [Data Science at the Command Line](http://datascienceatthecommandline.com) by Jeroen Janssens

> [The Mac OS X Command Line: Unix Under the Hood](http://www.wiley.com/WileyCDA/WileyTitle/productCd-0782143547.html) by Kirk McElhearn

---

# Variables y arrays

[Contenido](#Contenido)

Las variables en Bash funcionan de forma análoga a las variables en otros lenguajes de programación.  

Las variables en Bash no necesitan se declaradas (tal como en el lenguaje C) para ser usadas. Para hacer la asignación se utiliza el símbolo `=`; note que no puede haber espacio alrededor del `=`. En la segunda línea de código es necesario preceder el nombre de la variable por `$` para indicar que var1 es un nombre de variable y no una cadena de texto.

In [1]:
var1='hola mundo'
echo $var1 

hola mundo


In [2]:
echo var1

var1


A una variable se le puede asignar el resultado de un comando:

In [3]:
x=$(echo hola mundo)
echo $x

hola mundo


El shell solo soporta aritmética entera y está diseñado primariamente para operaciones del sistema operativo y cadenas de caracteres, por lo que en el siguiente código lo que se indica es que se están concatenando cadenas de caracteres.

In [4]:
x=1
y=$x+1
echo $y

1+1


Para indicar que se están realizando operaciones aritméticas hay dos opciones: la primera es utilizar el operador `$((` ... `))`  y la segunda es usar el comando `let`.

In [5]:
x=1
y=$((x+1))
echo $y

2


In [6]:
let x=1
let y=x+1
echo $y

2


El shell soporta los `+=`, `-=`, ... similares a los del lenguaje C. No pueden dejarse espacios alrededor de ellos.

In [7]:
let x=1
let x+=1
echo $x

2


Bash también permite el uso de arrays. Para crear un array es necesario colocar sus componentes entre `(` y `)`. Note que cuando se imprime con `echo` solo aparece el primer elemento.

In [8]:
x=(a b c d e)
echo $x

a


Para acceder a cada uno de los elementos se debe usar el operador `[` ... `]`, teniendo en cuenta que el primer elemento tiene índice cero, el segundo índice uno y así sucesivamente.

In [9]:
echo ${x[1]}

b


Para imprimir todos los elementos se debe usar `[*]`.

In [10]:
echo ${x[*]}

a b c d e


Se pueden usar las estructuras de iteración anteriores para recorrer los elementos del vector.

In [11]:
for n in ${x[*]}
do
    echo $n
done

a
b
c
d
e


Los elementos del vector también pueden ser modificados.

In [12]:
x[2]='hola'
for n in ${x[*]}
do
    echo $n
done

a
b
hola
d
e


<br>
<br>

# Scripts

[Contenido](#Contenido)

Los scripts son archivos que contienen secuencias de comandos y que pueden ser ejecutados directamente en la línea de comandos (Bash en este caso). En el siguiente ejemplo, se va a crear un script llamado `demo.sh` el cual imprime `hola mundo` en la pantalla. 

Se direcciona la salida al archivo en vez de la pantalla.

In [13]:
echo 'echo hola mundo' > demo.sh  



Se imprime en pantalla en contenido de demo.sh

In [14]:
cat demo.sh  

echo hola mundo


El archivo fue creado en el directorio de trabajo

In [15]:
ls *.sh  

demo.sh


Para ejecutarlo se usa el comando `bash`.

In [16]:
bash ./demo.sh  

hola mundo


Es posible hacer que el archivo `demo.sh`  sea ejecutable por el sistema operativo. 

En primer lugar, es necesario agregar la linea `#! /usr/bin/env bash` la cual indica que el archivo actual puede ser ejecutado usando el comando `bash`; obligatoriamente esta tiene que ser la primera línea del archivo.  La cadena de caracteres `#!` se conoce como *shebang*, *hashbang* o *sharpbang* en la jerga de Unix; después del shebang va el `path` donde se encuentra el programa que puede ejecutar el archivo actual; y finalmente, aparece el nombre del programa como tal.       

In [17]:
cat > demo <<EOF
#! /usr/bin/env bash
echo hola mundo
EOF



Se imprime el contenido de `demo.sh`.

In [18]:
cat demo

#! /usr/bin/env bash
echo hola mundo


En segundo lugar, se modifican las propiedades del archivo `demo.sh` con el comando `chmod` para hacerlo ejecutable (opción `+x`).

In [19]:
chmod +x demo



Para ejecutar `demo.sh` es necesario precederlo de `./` para indicar que el archivo se encuentra en el directorio actual de trabajo.

In [20]:
./demo

hola mundo


La ventaja de los scripts es que pueden ser usados pasándoles parámetros.

En este caso se modifica el programa anterior para que salude al usuario, cuyo nombre se pasa como un parámetro al script. `$1` corresponde al primer argumento de la llamada.

In [21]:
cat > demo.sh <<EOF
#! /usr/bin/env bash
echo hola \$1 \$2
EOF



In [22]:
cat demo.sh

#! /usr/bin/env bash
echo hola $1 $2


In [23]:
chmod +x demo.sh



In [24]:
./demo.sh juan david

hola juan david


Como se observó en el ejemplo anterior: 
* `$1` indica el primer argumento. 
* `$2` indica el segundo argumento, y así sucesivamente. 
* `$0` es el nombre del script. 
* `$*` y `$@` representan la cadena de texto conformada por todos los argumentos. 
* `$#` indica el número de argumentos pasados al script. 

In [25]:
echo "echo \$@
echo \$*
echo \$0
echo \$1
echo \$#" > demo.sh
cat demo.sh

echo $@
echo $*
echo $0
echo $1
echo $#


In [26]:
bash demo.sh a b c d

a b c d
a b c d
demo.sh
a
4


---

**Ejercicio.--** Escriba un script que imprima en pantalla la cantidad de registros para cada ciudad en el archivo `customer`. 

---

# Funciones

[Contenido](#Contenido)

En el siguiente ejemplo se crea una función en Bash. Después del nombre de la función siempre se escribe `()` y se delimita el cuerpo de la función usando llaves (`{`  y `}`).

In [27]:
demo(){
  echo hola mundo
}



Para ejecutar la función simplemente se escribe su nombre (sin `()`).

In [28]:
demo

hola mundo


Los argumentos se notan como `$1`... al igual que en los scripts. En este caso `$0` es el `bash` y no se puede acceder al nombre de la función. Note que en la llamada a la función no se usan paréntesis, tal como si ocurre en otros lenguajes de programación.

In [29]:
demo() {
  echo $@
  echo $*
  echo $0
  echo $1
  echo $#
}
demo a b c d

a b c d
a b c d
/bin/bash
a
4


Las funciones pueden ser almacenadas y ejecutadas dentro de un script, tal como se muestra a continuación.

In [30]:
cat > maxmin.sh <<EOF 
min2(){
    echo 'arg1 (min2): ' \$1
    echo 'arg2 (min2): ' \$2
    if ((\$1 < \$2))
    then 
        echo \$1
    else
        echo \$2
    fi        
}

max2(){
    echo 'arg1 (max2): ' \$1
    echo 'arg2 (max2): ' \$2
    if ((\$1 > \$2))
    then 
        echo \$1
    else
        echo \$2
    fi        
}

max2 \$3 \$4
min2 \$1 \$2
EOF



In [31]:
bash maxmin.sh 10 20 30 40

arg1 (max2):  30
arg2 (max2):  40
40
arg1 (min2):  10
arg2 (min2):  20
10


<br>
<br>

# Estructuras de control

[Contenido](#Contenido)

## Decisión con `if-then-else-fi` y `case-esac`

[Contenido](#Contenido)

En el siguiente ejemplo se codifica la función `min2` la cual recibe dos números enteros e imprime el menor de ellos. Si ambos números son iguales, se imprimen ambos argumentos. En este ejemplo también se presenta la estructura condicional `if`; para que el condicional sea evaluado correctamente es necesario colocar la expresión entre `((` y `))`. 

In [32]:
min2(){
    if (($1 < $2))
    then 
        echo $1
    elif (($1 == $2))
    then
        echo $1 $2
    else
        echo $2
    fi        
}
min2 1 2

1


In [33]:
min2 2 1

1


In [34]:
min2 2 2

2 2


El siguiente codigo lee los nombres de los archivos del directorio actual e imprime los que son un jupyter notebook. En la primera línea, `*` indica los archivos y directorios en el directorio actual de trabajo.  En la cuarta línea, `*.ipynb` indica que el nombre de archivo (almacenado en `x`) debe terminar en la extensión `.ipynb`. La expresión `*)` en la quinta línea es el caso por defecto (cualquier nombre de archivo), es decir, se ejecuta si no han cumplido ninguna de las instrucciones especificadas por las sentencias `case` anteriores.

In [35]:
for x in *
do
    case $x in
        *.ipynb) echo -n -e $x ' es un Jupyter notebook\n';;
        *) 
    esac
done

transformacion-datos-bash-1.ipynb  es un Jupyter notebook
transformacion-datos-bash-2.ipynb  es un Jupyter notebook
transformacion-datos-bash-3.ipynb  es un Jupyter notebook


---

**Ejercicio.--** Escriba una función, llamada `mathop` que recibe tres argumentos y ejecuta el cálculo especificado. Por ejemplo:
```
mathop 1 + 2
mathop 1 * 2
mathop 1 - 2
```

**Ejercicio.--** Escriba una función que calcule el factorial de su argumento.

**Ejercicio.--** Escriba una función que reciba un número variable de argumentos y calcule su suma.

---

## Ciclos definidos con `for`

[Contenido](#Contenido)

A continuación se presentan varios ejemplos de procesos iterativos usando `for`.

In [36]:
# imprime los números del 1 al 5.
for x in 1 2 3 4 5  
do
    echo -n $x ''
done

1 2 3 4 5 

In [37]:
# el mismo ejemplo anterior.
for x in $(seq 1 5) 
do
    echo -n $x ''
done

1 2 3 4 5 

In [38]:
# de nuevo, el mismo ejemplo anterior
for x in {1..5} 
do
    echo -n $x ''
done

1 2 3 4 5 

In [39]:
# note que la expresión va entre '(('  y '))'
for ((x=1; x <= 5; x++))  
do
  echo -n $x ''
done

1 2 3 4 5 

En el siguiente ejemplo se generarán las cadenas de texto `file1.txt`, `file2.txt` ... hasta `file5.txt` usando un ciclo `for`. El nombre de la variable debe encerrarse entre `${` y `}` para distingirlo del resto de la cadena de texto. Es decir, si se coloca `echo filex.txt` o `echo file$x.txt` el interprete no puede diferenciar el nombre de la variable (`x`) del texto restante.

In [40]:
for x in {1..5} 
do
    echo file${x}.txt
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


De hecho, se pueden generar salidas mucho más complejas, tal como se ilustra a continuación (Ok! no se necesita el for para esto, pero es para ejemplificar).

In [41]:
# el for recibe el resultado de ejecutar la expresión entre '$('  y  ')'.
for x in $(seq -f'file%g.txt' 5) 
do
    echo '--->' $x
done

---> file1.txt
---> file2.txt
---> file3.txt
---> file4.txt
---> file5.txt


En el siguiente ejemplo se genera un conjunto de archivos llamados `out.1`, `out.2`, ..., `out.5`. 

In [42]:
for x in {1..5}
do
    seq -f'linea %g' 5 > out.${x}
done
ls out.*

out.1	out.2	out.3	out.4	out.5


A continuación se usa el comando `head` para iterar sobre los archivos e imprimir la primera línea de cada uno de ellos.

In [43]:
head1(){
    for x in out.*
    do
        head -n 1 $x
    done
}
head1

linea 1
linea 1
linea 1
linea 1
linea 1


## Ciclos condicionales con `while` 

[Contenido](#Contenido)

El último ejemplo puede ser realizado usando un ciclo `while` en vez de un ciclo `for`. En este caso, el condicional puede ser especificado con la palabra clave `test` o colocando el condicional entre `((` y `))`.  

In [44]:
n=1
while test $n -le 5
do
    echo file${n}.txt
    n=$((n+1))
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


In [45]:
n=1
while (($n <= 5))
do
    echo file${n}.txt
    n=$((n+1))
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


## Ciclos condicionales con `until`

[Contenido](#Contenido)

Otra forma alternativa es usar un ciclo `until`.

In [46]:
n=1
until (($n > 5))
do
    echo file${n}.txt
    n=$((n+1))
done

file1.txt
file2.txt
file3.txt
file4.txt
file5.txt


En el último ejemplo de esta sección, se codifica una función que recibe una lista de enteros e imprime el menor de ellos.

In [47]:
minimum(){
    n=$1
    for x in $*
    do
        if test $x -lt $n 
        then
            n=$x
        fi
    done
    echo $n
}
minimum 6 1 7 5 1 2  5

1


---

**Ejercicio.--** Escriba una función que genere un número entero consecutivo por cada valor diferente en un campo de un archivo CSV. Uselo en el archivo del ejercicio anterior.

---

<br>
<br>

# Cálculos numéricos en punto flotante

[Contenido](#Contenido)

(El comando bc no está disponible en Try Jupyter!)


Como ya se indicó, Bash solo puede realizar aritmética entera. Para realizar cálculos en punto flotante se debe usar el comando `bc` o el comando `dc`. Se iniciará con `bc`. Para realizar una operación aritmética, como por ejemplo la suma, se debe generar una cadena de la forma `1.0+2.0+3.0`, la cual es pasada a `bc`. El siguiente código muestra como se genera dicha cadena en cada iteración del ciclo `for`. La variable `s` se usa para almacenar la expresión matemática como una cadena de caracteres. 

In [48]:
s=0
for x in 1.1 2.2 3.3
do
    s=$(echo $s \+ $x)
    echo $s
done

0 + 1.1
0 + 1.1 + 2.2
0 + 1.1 + 2.2 + 3.3


Ahora se le pasa la cadena almacenada en `s` a `bc`.

In [49]:
s=0
for x in 1.1 2.2 3.3 
do
    s=$(echo $s \+ $x)
done
echo $s | bc

6.6


Otra forma sería usar la variable `s` para almacenar la suma parcial, tal como se ejemplifica a continuación.

In [50]:
s=0
for x in 1.1 2.2 3.3
do
    s=$(echo $s \+ $x | bc)
    echo $s
done

1.1
3.3
6.6


Ahora se puede encapsular el código en una función que sume sus argumentos.

In [51]:
sum(){
    s=0
    for x in $*
    do
        s=$(echo $s \+ $x)
    done
    echo $s | bc
}
sum 1.1 2.1 3.1 4.1

10.4


El comando `dc` es una calculadora de notación postfija. El siguiente código permite sumar los números 1, 2 y 3. Se debe colocar la letra `p` al final para que imprima el resultado.

In [52]:
echo '1 2 + 3 + p' | dc

6


In [53]:
sum(){
    s=0
    for x in $*
    do
        s=$(echo $s  $x \+)
    done
    echo $s ' p'  | dc
}
sum 1.1 2.1 3.1 4.1

10.4


---

**Ejercicio.--** Escriba la función `csvsum` que recibe un archivo CSV, el número del campo clave y el número del campo a sumar, y retorna la suma de la columna especificada para cada valor único del campo clave. 

In [54]:
cat > out.1 <<EOF
Date, Year, CustomerID, Value
   2013-01-12, 2013, 1, 10.1
   2013-02-25, 2013, 2, 20.3
   2013-02-28, 2013, 1, 10.4
   2013-04-04, 2013, 1, 14.0
   2013-06-21, 2013, 2, 21.2
   2013-08-02, 2013, 1, 12.5
   2014-05-12, 2014, 1, 31.4
   2014-05-12, 2014, 2, 14.2
   2014-05-12, 2014, 1, 12.0
EOF



**Ejercicio.--** Escriba la función `cpaste` que ejecuta un join cartesiano de dos archvos. Esto es, la primera fila del primer archivo con todas las filas del segundo archivo; luego la segunda fila del primer archivo con todas las filas del segundo archivo y así sucesivamente. 

**Ejercicio.--** Escriba una función que concatene correctamente dos archivos CSV que tienen las mimas columnas, pero en diferente orden. Usela para concatenar los dos archivos especificados a continuación.

In [55]:
cat > out.1 <<EOF
   A, B, C
   1, 2, 3
   4, 5, 6
EOF



In [56]:
cat > out.2 <<EOF
   A, C, B
   7, 8, 9
   10, 11, 12
EOF



**Ejercicio.--** Verifique que la función del ejercicio anterior opera correctamente con: 

In [57]:
cat > out.1 <<EOF
   A, B, C
   1, 2, 3
   4, 5, 6
EOF



In [58]:
cat > out.2 <<EOF
   A, C
   7, 8
   10, 11
EOF



**Ejercicio.--** Agregue el campo `subtotal` al archivo `orderline` que es calculado como `quantity` * `price`. 

**Ejercicio.--** Agregue el campo `total` al archivo `order` el cual corresponde al valor total de la venta en cada orden. 

**Ejercicio.--** Agregue el campo `quarter` y sus correspondientes valores al archivo `order`.

**Ejercicio.--** Genere los archivos `order.` *`CostumerID`*, los cuales contienen las órdenes para cada `CustomerID`.

**Ejercicio.--** Elimine el campo `Email` del archivo `customer`.

**Ejercicio.--** Genere un archivo con el total pagado a cada `supplier` (archivo `product`) por año. 

**Ejercicio.--** Transforme un archivo de CSV a CSV2 (CSV en español).

**Ejercicio.--** Transforme un archivo de CSV2 a CSV.

**Ejercicio.--** Transforme un archivo CSV a formato de ancho fijo (FAF).

**Ejercicio.--** Tranforme un archivo de ancho fijo (FAF) a CSV.

---

<br>
<br>

# Implementación de herramientas escritas en otros lenguajes   

[Contenido](#Contenido)

Una de las características primordiales del sistema operativo Unix es que los comandos como cat y ls, realmente son programas (almacenados en archivos) que existen en el disco duro del computador y el interprete de comandos los ejecuta en respuesta a las acciones del usuario. Cada uno de estos programas puede estar escrito en un lenguaje de programación y el interprete permite que se ejecuten de una forma transparente. Consecuentemente, la utilidad de la línea de comandos radica en la posibilidad de crear nuevas herramientas con el lenguaje de programación que sea más ventajoso para cada tarea particular, y combinarlas con las herramientas existentes.  

## Herramientas en Python

[Contenido](#Contenido)

Como primer ejemplo, se escribirá una herramienta `seq.py` en el lenguaje Python, la cual  recibe como parámetro un entero `n` e imprima la secuencia de `1` hasta `n`. Si se desea una herramientas que funcione de forma similar a los comandos del sistema operativo se obviaría la extensión del archivo. 

El primer paso es ubicar el directorio de instalación de Python usando el comando `which`.

In [59]:
which -a python

/Users/jdvelasq/anaconda/bin/python
/usr/bin/python


El resultado anterior indica que hay dos instalaciones de Python en la máquina local. El primer interprete está en el directorio `/Users/jdvelasq/anaconda/bin/python` y el segundo en `/usr/bin/python`. Para determinar que versión de Python se encuentra instalada en cada directorio se llama el interprete con la opción `--version`. 

In [60]:
/Users/jdvelasq/anaconda/bin/python --version

Python 3.5.2 :: Anaconda custom (x86_64)


In [61]:
/usr/bin/python --version

Python 2.7.10


Esto indica que están instaladas las versiones 3.5.1 y 2.7.10. Ya que el directorio `/Users/jdvelasq/anaconda/bin/python` está en primero en el path de la máquina, cuando se invoca el interprete se ejecuta Python 3.5.1. Por ejemplo:

In [62]:
python --version

Python 3.5.2 :: Anaconda custom (x86_64)


En la siguiente porción de código se escribe la herramienta `seq.py`.

In [63]:
cat > seq.py >>EOF
import sys
x = int(sys.argv[1])
for i in range(x):
    print i+1,
EOF




La sentencia `import sys` indica que se debe cargar la librería con las funciones del sistema. La variable `sys.argv`  es una lista que contiene los argumentos de la llamada; `sys.argv[0]` es el nombre del programa (`seq.py`) y `sys.argv[1]` es el entero `n`.

Para ejecutarla es invoca el interprete de Python ubicado en el directorio `/usr/bin/python`.

In [64]:
/usr/bin/python seq.py 5



Para comvertir el programa anterior en una herramienta del sistema operativo, se adiciona el shebang (`#!`) y se cambian las propiedades del archivo para hacerlo ejecutable usando `chmod`. 

In [65]:
echo > seq.py <<EOF
#! /usr/bin/python
import sys
x = int(sys.argv[1])
for i in range(x):
    print i+1,
EOF



In [66]:
chmod +x seq.py



Para ejecutar el programa ya no es necesario invocar el interprete de Python.

In [67]:
./seq.py 4



## Herramientas en R

[Contenido](#Contenido)

También es posible escribir herramientas en R. En este ejemplo se escribirá una herramienta que genere una secuencia de números aleatorios. En primer lugar (al igual que en el caso anterior), se obtiene la ubicación del interprete del lenguaje R para la consola de comandos.

In [68]:
which -a Rscript

/usr/local/bin/Rscript


Seguidamente, se escribe el código en R en el archivo `unif.R` y se cambian las propiedades del archivo para hacerlo ejecutable usando `chmod`.

In [69]:
echo > unif.R <<EOF
#! /usr/bin/env Rscript
args <- commandArgs(trailingOnly=TRUE)  
cat(runif(as.numeric(args)), sep='\n')  
EOF



In [70]:
chmod +x unif.R



En este caso, y de forma similar al programa escrito en Python, args es una variable que almacena los argumentos con que se llama el programa `unif.R`. 

En este punto ya es posible usar la herramienta para generar secuencias de números aleatorios uniformemente distribuidos.

In [71]:
./unif.R 5



La potencia de la línea de comandos radica en que el Bash actua como un pegante que permite usar las herramientas escritas en distintos lenguajes. Como siguiente ejemplo, se desea escribir una función en `bash` llamada `randunif` que genere `n` archivos llamados `out.*` los cuales contienen `m` números aleatorios uniformes. Por ejemplo, la llamada `randunif 2 4` genera 2 archivos con 4 números aletorios cada uno. La función `randunif` es codificada en `bash`:

In [72]:
randunif(){
    for n in $(seq $1)
    do
        echo $(./unif.R $2) > aux.${n}
        tr ' '  '\n' < aux.${n} > out.${n}
        rm aux.${n}  
    done
}



A continuación se generan los archivos `out.1`, `out.2` y `out.3` con 5 números aleatorios cada uno:

In [73]:
randunif 3 5



In [74]:
cat out.1




In [75]:
cat out.2




In [76]:
cat out.3




**Limpieza del directorio de trabajo.**

In [77]:
rm *.sh
rm out*
rm *.py
rm *.R



---

[Contenido](#Contenido)