<img align="left" src="img/logo-ucm.png" width="25%">
<br/><br/><br/><br/><br/>


# [Doctorado en Ingeniería (DocIng)](http://www.docing.ucm.cl/index.html)

# [Doctorado en Modelamiento Matemático Aplicado (DM<sub>2</sub>A)](http://vrip.ucm.cl/doctorado-en-modelamiento-matematico-aplicado/)


## Computación Científica I: Introducción a Python para la Investigación. 
### Programación estructurada. Sintaxis básica: operadores, variables, tipos de datos, estructuras de control, funciones, librerías, entrada y salida estándar.

&nbsp;
### Profesor: Dr. Ruber Hernández García

<div style="overflow: hidden; display: inline-block;">
    <div style="display: inline-block; max-width: 20%; max-height: 20%;">
        <a href="mailto:rhernandez@ucm.cl">
            <img src="img/email.webp" alt="email" height="24px" width="24px">
        </a>
    </div>
    <div style="display: inline-block; max-width: 20%; max-height: 20%;">
        <a href="www.ruberhg.com">
            <img src="img/website-icon.jpeg" alt="website" height="24px" width="24px">
        </a>
    </div>
    <div style="display: inline-block; max-width: 20%; max-height: 20%;">
        <a href="https://orcid.org/0000-0002-9311-1193">
            <img src="img/orcid.png" alt="orcid" height="24px" width="24px">
        </a> 
    </div>
    <div style="display: inline-block; max-width: 20%; max-height: 20%;">
        <a href="https://github.com/ruberhg" rel="nofollow noreferrer">
            <img src="img/github.png" alt="github" height="24px" width="24px">
        </a>
    </div>
</div>



----

## Sintaxis de Python: funciones, módulos y paquetes

Lo más importante para programar, y no solo en Python, es saber organizar el código en piezas más pequeñas que hagan tareas independientes y combinarlas entre sí. Las **funciones** son el primer nivel de organización del código: reciben unas *entradas*, las *procesan* y devuelven unas *salidas*. Asimismo, los **módulos y paquetes** conforman otro nivel de organización de más alto nivel, al permitir agrupar un conjunto de clases y/o funciones.

![Black box](img/blackbox.jpg)

## Funciones

Hasta ahora hemos definido código en una celda: declaramos parámetros en variables, luego hacemos alguna operación e imprimimos y/o devolvemos un resultado. 

Para generalizar esto podemos declarar **funciones**, de manera de que no sea necesario redefinir variables en el código para calcular/realizar nuestra operación con diferentes parámetros. En Python las funciones se definen con la sentencia `def` y con `return` se devuelve un valor.

<div class="alert alert-warning"><strong>Importante:</strong> Es importante resaltar que las variables que se crean dentro de las funciones no son accesibles una vez que termina la ejecución de la función, lo que se conoce como <strong><em>"Scope"</em></strong> de las variables. En cambio, la función si que puede acceder a cosas que se han definido fuera de ella. No obstantes, esto último no constituye una buena práctica de cara la reproducibilidad, mantenibilidad y testeo de la función.</div>

In [1]:
def potencia(numero, exponente=2):
    """Dado un escalar, 
    devuelve su potencia"""        # Documentación de la función
    resulta = numero**exponente
    return resulta

In [2]:
potencia(3)
help(potencia)

Help on function potencia in module __main__:

potencia(numero, exponente=2)
    Dado un escalar, 
    devuelve su potencia



In [3]:
potencia(2e10)

4e+20

In [4]:
potencia(5-1j)

(24-10j)

In [5]:
potencia(exponente=3 + 2,numero=1 + 4)       # se pueden pasar los parámetros por nombres

3125

<div class="alert alert-info">Notar que no <strong>exigimos un tipo de dato</strong> en la definición de la función. Python es dinámico: se esperan <strong>comportamientos</strong> en vez de tipos. Un tipo de datos puede implementar distintos comportamientos y <em>"funcionar"</em>.

Si un número, cualquiera sea su tipo, puede elevarse al cuadrado, ¿por qué deberíamos hacer una función equivalente para enteros, otra para flotantes de simple precisión y otra para complejos como se hace en otros lenguajes?

Esto es lo que se conoce como <strong><a href="https://es.wikipedia.org/wiki/Duck_typing">"Duck typing"</a></strong>, que es el estilo de orientación a objetos que utiliza Python.

<p style="margin-left: 30px"><em>"Cuando veo un ave que camina como un pato, nada como un pato y suena como un pato, a esa ave yo le digo pato."</em></p>
</div>

Obviamente, si el objeto (el tipo del objeto) que pasamos no soporta el comportamiento que esperamos (en este caso no se puede "elevar al cuadrado" una cadena) fallará. 

In [6]:
potencia("hola mundo")

TypeError: unsupported operand type(s) for ** or pow(): 'str' and 'int'

### Un paréntesis: documentando las funciones `docstrings`

La documentación de una función se almacena en el llamado `docstring`. Esta cadena de documentación va justo después de la cabecera y se define entre comillas triples. Módulos, funciones, métodos y clases pueden tener una "cadena de documentación". Python automáticamente asigna esa cadena al atributo `__doc__` del objeto en cuestión.

Los `docstrings` **son opcionales pero muy recomendados**, porque a diferencia de los comentarios (que se ponen con `#`), son los que se muestran en la ayuda interactiva y tambien pueden post-procesarse para generar documentación de referencia automática.

Es una buena práctica, no solo documentar las funciones, sino hacerlo con un estilo único y estandarizado. Una referencia respaldada en el ecosistema científico es el estilo de documentación de NumPy: https://numpydoc.readthedocs.io/en/latest/format.html#docstring-standard

In [None]:
help(potencia)

potencia.__doc__ = "Recibe un escalar y dado un exponente, devuelve su potencia."

help(potencia)

### Parámetros arbitrarios: `*args` y `**kwargs`

Hasta acá todo bonito. Pero ¿qué tal si queremos definir una función que acepte una cantidad arbitraria de parámetros? Acá vienen `*args` y `**kwargs`. Por ejemplo la función `zip` recibe una cantidad arbitraria de iteradores y devuelve tuplas con los i-elementos de cada una.

In [1]:
list(zip((1, 2, 3), ('a', 'b', 'c'), ('alfa', 'beta', 'gama', 'theta')))

[(1, 'a', 'alfa'), (2, 'b', 'beta'), (3, 'c', 'gama')]

__*Entonces ¿cómo definiríamos una función al estilo  `zip` que recibe cuantos argumentos queramos?*__

In [5]:
def promedio(*args):
    """
    Calcula el promedio de todos los argumentos dados
    """
    
    print(args)         # args es una tupla de los argumentos posicionales dados. 
    
    suma = 0
    for num in args:        
        suma += num     # igual a suma = suma + num
    
    return suma/len(args)

In [6]:
promedio(3, 4, 2, 5)

(3, 4, 2, 5)


3.5

In [None]:
promedio(10, 20, 2.1)

__Por otro lado, tenemos como ejemplo el constructor `dict` que acepta una cantidad de argumentos arbitrarios por clave para crear un diccionario:__

In [2]:
dict(Carlitos=10, Gaitán='Jugador Nº 12', Gonzales='no juega')

{'Carlitos': 10, 'Gaitán': 'Jugador Nº 12', 'Gonzales': 'no juega'}

__*¿Cómo definir una función que permita esa flexibilidad? Eso se hace con `**kwarg`*__

In [3]:
def itemizar(**kwargs):
    """
    Genera una lista de items con todos los argumentos dados
    """
    
    for clave, valor in kwargs.items():
        print('* {0} ({1})'.format(clave, valor))

In [4]:
itemizar(tornillos=10, lija=2, cualquiera=10, cosa=40)

* tornillos (10)
* lija (2)
* cualquiera (10)
* cosa (40)


<div class="alert alert-info">En resumen, con <strong>`*args`</strong> se indica <em>"mapear todos los argumentos posicionales no explícitos a una tupla llamada `args`"</em>. Y con <strong>`**kwargs`</strong> se indica <em>"mapear todos los argumentos de palabra clave no explícitos a un diccionario llamado `kwargs`"</em>.
<br/><br/>
No es necesario los nombres "args" y "kwargs", podemos llamarlas diferente, pero es una convención muy extendida. Estrictamente, los simbolos que indican cantidades arbitrarias de parametros son `*` y `**`. Además es posible poner parametros "comunes" antes de los parametros arbritarios.
</div>

In [None]:
def f(a1,*args,**kwargs):
    print('a1=', a1)
    print('args=', args)
    print('kwargs=', kwargs)


In [None]:
f(4)   # solo definido el parámetro común a

In [None]:
f('valor', 1, 2)    # 'a1' y dos argumentos posicionales arbitrarios

In [None]:
f('2', 1, 2, color='azul', detallado=True)  # 'a1', dos argumentos posicionales arbitrarios y dos argumentos codificados arbitrarios

<div class="alert alert-info">
Para más información acerca otras características de las funciones en Python, ver el Extra de Funciones en: <code>extra/extra_funciones.ipynb</code>.
</div>



----

## Módulos


Buenísimo estos *notebooks* pero ¿qué pasa si quiero reusar código? 

Hay que crear **módulos o librerías**. 

Por ejemplo, creemos un módulo para guardar la función que encuentra raíces de segundo grado.

Podemos abrir cualquier editor (incluido el que trae el propio jupyter), o alternativamente podemos preceder la celda con la "función magic" (que aporta Jupyter y se denotan por empezar con `%` o `%%`), en este caso `%%writefile`

El resultado es dejar un archivo llamado `cuadratica.py` con el código de nuestra función en el mismo directorio donde tenemos el notebook (el archivo .ipynb).

In [None]:
%%writefile cuadratica.py     

def raices(a, b=0, c=0):
    """Dados los coeficientes, encuentra los valores de x tal que ax^2 + bx + c = 0"""

    discriminante = (b**2 - 4*a*c)**0.5
    x1 = (-b + discriminante)/(2*a)
    x2 = (-b - discriminante)/(2*a)
    return (x1, x2)

Lo hemos guardado en un archivo `cuadratica.py` en el directorio donde estamos corriendo esta consola (notebook), entonces directamente podemos **importar** ese módulo. 

In [None]:
import cuadratica

El módulo `cuadratica` importado funciona como "*espacio de nombres*", donde todos los objetos definidos dentro son atributos

In [None]:
cuadratica.raices

In [None]:
cuadratica.raices(3, 2, -1)

In [None]:
cuadratica.raices(3, 2, 1)

Importar un módulo es importar un "*espacio de nombres*", donde todo lo que el módulo contenga (funciones, clases, constantes, etc.) se accederá como un atributo del módulo de la forma  `módulo.<objeto>`

Cuando el nombre del espacio de nombres es muy largo, podemos ponerle un alias


In [None]:
import cuadratica as cuad   # igual que la primera forma pero poniendole un alias (mas breve). 

cuad.raices(24,6,-5)

Si **sólo queremos alguna unidad de código y no todo el módulo**, entonces podemos hacer una importación selectiva

In [None]:
from cuadratica import raices  # sólo importa el "objeto" que indequemos y lo deja 
                               # en el espacio de nombres desde el que estamos importando

In [None]:
raices?

Si, como sucede en general, el módulo definiera más de una unidad de código (una función, clase, constantes, etc.) podemos usar una tupla para importar varias cosas cosas al espacio de nombres actual. Por ejemplo:

      from cuadratica import raices, integral, diferencial 
 
Por último, si queremos importar todo pero no usar el prefijo, podemos usar el `*`, pero **esto no es recomendado**.
    
    from cuadratica import *

----

### Paquetes: módulos de módulos

Cuando tenemos muchos módulos que están relacionados es bueno armar un **paquete**. Un paquete de módulos es un simple directorio con un módulo especial llamado `__init__.py` (que puede estar vacio) y tantos módulos y subpaquetes como queramos. 


Los paquetes se usan igual que un módulo. Por ejemplo, supongamos que tenemos una estructura:

    paquete/
       __init__.py
       modulo.py

Puedo importar la `funcion_loca` definida en `modulo.py` así:

    from paquete.modulo import funcion_loca 


In [None]:
%mkdir paquete             # creamos un directorio  "paquete"

In [None]:
%%writefile paquete/__init__.py         
 
 

In [None]:
%%writefile paquete/módulo.py

def funcion_loca(w=300,h=200):
    _                                      =   (
                                        255,
                                      lambda
                               V       ,B,c
                             :c   and Y(V*V+B,B,  c
                               -1)if(abs(V)<6)else
               (              2+c-4*abs(V)**-.4)/i
                 )  ;v,      x=w,h; C = range(-1,v*x 
                  +1);import  struct; P = struct.pack;M, \
            j  =b'<QIIHHHH',open('img/M.bmp','wb').write; k= v,x,1,24
    for X in C or 'Mandelbrot. Adapted to Python3 by @tin_nqn_':
        j(b'BM' + P(M, v*x*3+26, 26, 12,*k)) if X==-1 else 0; i,\
            Y=_;j(P(b'BBB',*(lambda T: map(int, (T*80+T**9
                  *i-950*T  **99,T*70-880*T**18 + 701*
                 T  **9     ,T*i**(1-T**45*2))))(sum(
               [              Y(0,(A%3/3.+X%v+(X/v+
                               A/3/3.-x/2)/1j)*2.5
                             /x   -2.7,i)**2 for  \
                               A       in C
                                      [:9]])
                                        /9)
                                       )   )

In [None]:
from paquete import módulo as m # import funcion_loca
m.funcion_loca()

# podes ver el resultado creando una celda tipo Markdown con el contenido:
#
# ![](img/M.bmp)

![M](img/M.bmp)

In [None]:
from paquete import cuadratica as cuad

cuad.raices(24,6,-5)

----

## Biblioteca estándar: las baterías puestas de Python

Sin entrar en detalles, ya utilizamos algunos módulos que trae python, por ejemplo cuando importamos el módulo `math` para usar las funciones matemáticas y constantes que define
    
    import math

Hay muchísimas más funcionalidades que vienen incorporadas al lenguaje y están estandarizadas para que funcionen (salvo casos específicos) de la misma manera en cualquier implementación de Python y sistema operativo. Es lo que se conoce como la [biblioteca estándar de python](http://docs.python.org/3/library/), que es muy abarcadora y potente. 

Además de funciones matemáticas, manejo de algunos formatos de archivos más específicos que el "texto plano", protocolos de internet, otras *clases* de números y estructuras de datos,  etc.

Python es un lenguaje muy completo pero, aunque es muy grande, su librería estándar no es infinita. Por suerte hay [miles y miles de bibliotecas extras](https://pypi.python.org) para complementar casi cualquier aspecto en el que queramos aplicar Python. En algunos ámbitos, con soluciones muy destacadas.


## CSV

[CSV](https://es.wikipedia.org/wiki/CSV) (Comma Separated Values) es un formato de archivo abierto (un archivo de texto) para datos compartir datos estructurados tipo tabla. 

Es muy simple y básica pero muy usado para intercambiar información estructurada entre distintos programas. Por ejemplo, desde Excel o Libreoffice Calc se pueden guardar (y abrir) archivos `.csv`. Python posee un módulo específico para tratar este tipo de archivos. 

Ver [documentación](https://docs.python.org/3/library/csv.html)


In [7]:
!cat data/near_critical_oil.csv

Component,Mol fraction
n2,0.46
co2,3.36
c1,62.36
c2,8.9
c3,5.31
c4,3.01
c5,1.5
c6,1.05
c7,2.0
c7+,12.049


Para leer desde un archivo `.csv`:

In [None]:
import csv

with open('data/near_critical_oil.csv') as csv_file:
    reader = csv.reader(csv_file)
    
    critical_oil = [line for line in reader]   #también se puede usar: `list(reader)`
    
critical_oil

Para escribir en un archivo `.csv`, creamos un objeto `writer`:

In [None]:
datos = [('Nombre', 'Peso'), ('Juan', 92), ('La "Mole" Moli', 121), ('Martín', '5 kilos de más')]

with open('data/pesos.csv', 'w') as pesos_csv:
    writer = csv.writer(pesos_csv)
    writer.writerows(datos)

In [None]:
%cat data/pesos.csv

## Números aleatorios

Todas las funciones relacionadas a la aleatoriedad están en el módulo `random`. 

Ver [documentación](https://docs.python.org/3/library/random.html)

In [None]:
import random

# la función más básica
random.random()           # float aleatorio, 0.0 <= x < 1.0

In [None]:
random.randrange(-10, 11, 2)           # análogo a range() devuelve un numero aleatorio de la serie

In [None]:
random.choice([0.3, 10, 'A'])     # elige un elemento al azar de una secuencia no vacía

In [None]:
l = list(range(10))
random.sample(l, k=5)      # elige k elementos de la poblacion dada 

In [None]:
random.shuffle(l)       # "desordena" una lista (inline)
l

También tiene muchas funciones de probabilidad:

In [None]:
[method for method in dir(random) if method.endswith('variate')]

In [None]:
random.normalvariate??

In [None]:
sum(random.normalvariate(1, 0.25) for i in range(10000)) / 10000

In [None]:
import statistics

In [None]:
statistics.stdev((random.normalvariate(1, 0.25) for i in range(10000)))