### Objetivo
El objetivo de esta unidad conocer el uso de argumentos para indicar acciones a los programas.

Temas
* Argumentos de línea de comandos
* Repaso

1. Argumentos de línea de comandos

Si estás acostumbrado a usar programas existentes que tengan una interfaz de usuario de línea de comandos (en contraposición a una interfaz gráfica), probablemente esté familiarizado con los argumentos de la línea de comandos. Estas son las cadenas que escribe en la línea de comandos después del nombre de un programa que desea ejecutar

In [None]:
myprogram.py one two three

En el código anterior, uno dos y tres son las opciones de línea de comandos.

Para usar argumentos de línea de comandos en nuestros scripts de Python, importamos el módulo sys. A continuación, podemos acceder a los argumentos de la línea de comandos mediante la lista especial sys.argv. Ejecutar el código siguiente

In [1]:
%%bash
cd Curso_Python/src/
touch myprogram.py

Agregando la importación de sys a nuestro archivo myprogram.py

In [None]:
import sys

print(sys.argv)

In [None]:
python myprogram.py one two three

Podemos observar que sys.argv es una lista y que sus elementos son los argumentos dados por línea de comandos.

Fijémonos que el primer elemento de sys.argv es siempre el nombre del propio programa, por lo que el primer argumento de la línea de comandos está en el índice uno, el segundo en el índice dos, etc. Al igual que con la entrada, las opciones y los nombres de archivo dados en la línea de comandos Se almacenan como cadenas, por lo que si, por ejemplo, queremos utilizar un argumento de línea de comandos como un número, tendremos que convertirlo con int.

Los argumentos de línea de comandos son una buena forma de obtener información para los programas de Python por varias razones:

Todos los datos que su programa necesita estarán presentes al inicio de su programa, para que pueda hacer cualquier validación de entrada necesaria (como comprobar que los archivos estén presentes) antes de iniciar cualquier procesamiento.
Además, su programa podrá ejecutarse como parte de un script de shell y las opciones aparecerán en el historial de shell del usuario.
Podemos imprimir todos los argumentos:

In [None]:
import sys 

for elements in sys.argv: 
    print (elements) 

Generalmente, los argumentos necesitan ser mas flexibles, si te fijas en el ejemplo anterior, los argumentos deben cumplir un orden, no podemos olvidar el orden porque sino el programa no funcionará. Pero lo más útil sería pasar la información a nuestro programa usando nombre_argumento = valor, de esta manera no importaria el orden y sería más claro a que argumento le estamos asignando el valor. Un ejemplo clásico es:

In [None]:
$blastp -query cow.small.faa -db human.1.protein.faa -out cow_vs_human_blast_results.txt

Si notamos -query cow.small.faa, nos indica que hay un argumento llamado -query que tiene como valor un archivo llamado cow.small.faa.

Para hacer que nuestros programas usen argumento nombre=valor, tenemos que usar el módulo argparse ya que facilita la escritura de interfaces de línea de comandos fáciles de usar. El programa tiene que definir qué argumentos requiere, y argparse procesará los argumentos usando sys.argv. El módulo argpars también genera automáticamente mensajes de ayuda y uso y emite errores cuando los usuarios dan al programa argumentos inválidos.

El primer paso en el uso de argparse es crear un objeto ArgumentParser:

In [None]:
import argparse
 
parser = argparse.ArgumentParser()

El objeto ArgumentParser almacenará toda la información necesaria para analizar la línea de comandos en tipos de datos Python.

<img src="./Curso_Python/img/arguments.png">

Llenar un ArgumentParser con información sobre los argumentos del programa se realiza haciendo llamadas al método add_argument(). Generalmente, estas llamadas le dicen al ArgumentParser cómo tomar las cadenas en la línea de comandos y convertirlas en objetos. Esta información se almacena y se utiliza cuando se llama parse_args().

In [None]:
parser.add_argument( 
      "-u", "--usage", 
            help="Programa que lee un archivo: ejemplo de ejecucion\n python argumentos.py -f dna.txt", 
            action="store_true")
parser.add_argument(
      "-f", "--file", 
            help="Nombre de archivo a procesar")
            
args = parser.parse_args()

Finalmente, una vez que definimos los argumentos a usar en nuestro programa, podemos utilizar el objeto de tipo ArgumentParser, que en el ejemplo esta almacenado en la variable args. En el ejemplo nuestro objeto args usa el argumento file e imprimir el nombre del archivo que esta siendo pasado al programa desde linea de comando:

In [None]:
# Aqui procesamos lo que se tiene que hacer con cada argumento
if args.file:
    print ("El nombre de archivo a procesar es: ", args.file)


Ejecución usando el argumento -f :

In [None]:
python argumentos.py -f dna.txt

El nombre de archivo a procesar es:  dna.txt

Ejecución usando el argumento -h

In [None]:
python argumentos.py -h

  -h, --help            show this help message and exit
  -u, --usage           Programa que lee un archivo: ejemplo de ejecución
                        python argumentos.py -f agenda.txt
  -f FILE, --file FILE  Nombre de archivo a procesar

Realicemos un ejemplo completo:

Generar un script que lea los datos de gapminder_gdp_oceania.csv y genere un gráfico de resultado.

Utilizar argumentos para solicitar:
Archivo de entrada -file
Archivo de salida -output

Opcional:
Argumento para el modo de uso
Argumento para desplegar el autor

Los dos argumentos serán obligatorios y no podrá seguir la ejecución del programa si no son proporcionados.

Ejemplo de modo de ejecución:

python3 gapminder_gdp.py -f ../data/gapminder_gdp_oceania.csv -o ../results/

In [None]:
import sys
import argparse
 
parser = argparse.ArgumentParser()
parser.add_argument( 
      "-u", "--usage", 
            help="Muestra un ejemplo de ejecutar el programa", 
            action="store_true")
parser.add_argument(
      "-f", "--file",
            help="Nombre de archivo a procesar")
parser.add_argument(
      "-o", "--output", 
            help="Ruta de salida de grafico")
parser.add_argument( 
      "-a", "--author", 
            help="Muestra el autor", 
            action="store_true")
            
args = parser.parse_args()



### Validamos los argumentos

In [None]:
if args.usage:
    print("Programa que lee un archivo: ejemplo de ejecucion\npython3 gapminder_gdp.py -f ../data/gapminder_gdp_oceania.csv -o ../results/")
    sys.exit()
    
if args.author:
    print("Author: Kevin Alquicira, email: kevin@ier.unam.mx")
    sys.exit()

if not args.file:
    print("Es necesario el argumento y valor -f")
    sys.exit()

if not args.output:
    print("Es necesario el argumento y valor -o")
    sys.exit()

Leyendo archivo

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
data_gdp = pd.read_csv(args.file, index_col='country')


years = data_gdp.columns.str.strip('gdpPercap_')

# Convert year values to integers, saving results back to dataframe

data_gdp.columns = years.astype(int)

In [None]:
Generando gráfico

In [None]:
data_gdp.T.plot()
plt.ylabel('GDP per capita')

fig = plt.gcf() 
fig.savefig(args.output+'GDP_per_capita.png')
plt.show()

Repaso
Importando la librería:

sys: librería que permite el uso del método argv
argv: método que devuelve en lista los argumentos proporcionados desde línea de comandos

argparse: librería que permite la manipulación de argumentos

Referencias:
   http://46.101.4.154/Art%C3%ADculos%20t%C3%A9cnicos/Python/ArgParse.pdf
    
Parser for command-line options, arguments and sub-commands https://docs.python.org/3/library/argparse.html