# Introducción a Python para ciencias e ingenierías (notebook 2)


Ing. Martín Gaitán


**Links útiles**

Repositorio del curso:

### http://bit.ly/cursopy

Python "temporal" online: 

### http://try.jupyter.org

- Descarga de [Python "Anaconda"](http://continuum.io/downloads#py34)
- Resumen de [sintaxis markdown](https://github.com/jupyter/strata-sv-2015-tutorial/blob/master/resources/Working%20With%20Markdown%20Cells.ipynb)


## Funciones


Hasta ahora hemos definido código en una celda: declaramos parámetros en variables, luego hacemos alguna operación e imprimimos y/o devolvemos un resultado. 

Para generalizar esto podemos declarar **funciones**, de manera de que no sea necesario redefinir variables en el código para calcular/realizar nuestra operación con diferentes parámetros. En Python las funciones se definen con la sentencia `def` y con `return` se devuelve un valor

In [1]:
def cuadrado(numero):
    """Dado un escalar, devuelve su potencia cuadrada"""
    resulta = numero**2
    return resulta

In [None]:
cuadrado(3)

In [None]:
cuadrado(2e10)

In [None]:
cuadrado(5-1j)

In [None]:
cuadrado(3 + 2)

Notar que no **exigimos un tipo de dato** en la signatura. Python es dinámico: se esperan **comportamientos** en vez de tipos. Un tipo de datos puede implementar distintos comportamientos y *"funcionar"* 

Si un número, cualquiera sea su tipo, puede elevarse al cuadrado, ¿por qué deberíamos hacer una función equivalente para enteros, otra para flotantes de simple precisión y otra para complejos como se hace en otros lenguajes?

Esto es lo que se conoce como **[Duck typing](https://es.wikipedia.org/wiki/Duck_typing)**, que es el estilo de orientación a objetos que utiliza Python. 

   *"Cuando veo un ave que camina como un pato, nada como un pato y suena como un pato, a esa ave yo le digo pato."*



In [2]:
cuadrado("hola mundo")

TypeError: unsupported operand type(s) for ** or pow(): 'str' and 'int'

Obviamente, si el objeto (el tipo del objeto) que pasamos no soporta el comportamiento que esperamos (en este caso no se puede "elevar al cuadrado" una cadena) fallará. 

Pero es mejor que nos avise del error, ¿no? ¿Por qué querríamos elevar una cadena al cuadrado? ¿qué significado tendría?


![](http://img.desmotivaciones.es/201109/CliffRobertsonSpiderman1.jpg)




#### Parámetros y más parámetros

La definción de funciones es muy flexible. No exige ni siquiera pasar parámetros o devolver resultados


In [3]:
# definimos una funcion que no recibe ni devuelve parámetros pero hace algo. 
def hola():
    """
    una función que saluda
    de una manera muy amable
    
    """
    print("¡Hola curso!")

hola()   # llamamos a esa función

¡Hola curso!


In [None]:
print(hola())

Si la función no tiene un `return`, lo que devuelve es `None`.

In [None]:
saludo = hola()

### Un paréntesis: docstrings

Módulos, funciones, métodos y clases pueden tener una "cadena de documentación", que se define como un string 
en la primera linea del cuerpo. Python automáticamente asigna esa cadena al atributo `__doc__` del objeto en cuestión.

Los `docstrings` **son opcionales pero muy recomendados**, porque a diferencia de los comentarios (que se ponen con `#`), son los que se muestran en la ayuda interactiva y tambien pueden post-procesarse para generar documentación de referencia automática



In [None]:
hola.__doc__ = 'hola'


Tip: `__doc__` es un atributo que se puede escribir, por lo tanto podríamos asignarle un texto construído dinámicamente

#### Múltiples puntos de salida

También puede haber múltiples `return` en una función. El primero en ejecutarse determinará el valor que la función devuelve

In [None]:
def saludo(coloquial):
    if coloquial:
        VAL = "Hola chochamus!"
        return VAL
    else:
        return "Buenas tardes, señores"
    
    # Esto tambien podria ser una linea con la estructura ternaria
    # return "Hola chochamus!" if coloquial else  "Buenas tardes, señores"
    

saludo(1)

In [None]:
saludo(coloquial=True)

### Parámetros opcionales

Se pueden definir parámetros opcionales, que **toman un valor *default* ** cuando no se los explicíta

La función `saluda` recibe un parámetro requerido `nombre` (es requerido porque no tiene valor por omisión)  y dos parámetros opcionales (`saludo` y `sufijo`). 

- Si sólo paso 1 parámetro será `nombre` y los valores default se usarán para los otros parámetros 
- Si paso 2 se usaran para `nombre` y `saludo` mientras que `sufijo` usará el default
- Si paso todos los parámetros no se usaran los valores por omisión.


In [None]:
def saludar(nombre, saludo="Hola", sufijo="¿qué tal?"):
    """Dado un nombre y, opcionalmente, un saludo y/o sufijo, devuelve 
    una cadena saludo + nombre + sufijo"""
    
    return "{} {}, {}".format(saludo, nombre, sufijo)  

print(saludar("Martín"))
print(saludar("Fernando", 'Ey'))
print(saludar("Lionel Messi", "Estimado", 'usted es un genio'))

In [None]:
saludar('oscar')

Pero ¿qué pasa si quiero usar el default para `saludo` pero no para `sufijo`? 

Podemos pasar los **parámetros por nombre**

In [None]:
saludar('Lionel', sufijo="que golazo hiciste")    # saludo no se explicitó, se usa el default ("Hola")

Entre los parámetros por nombre no importa el órden, pero si mezclamos las dos formas, los **parámetros por posición, deben ir antes** de los parámetros por nombre. 

#### Ejercicios

1. Definir una función para encontrar las raíces en el plano real en la ecuación de segundo grado  
$$x_{1,2} = \frac{-b \pm \sqrt {b^2-4ac}}{2a}$$ El parámetro `a` es obligatorio, y `b` y `c` son opcionales con default 0. Devuelve una tupla con ambas raices. Luego mejore la implemtación para encontrar también las raices en el plano complejo cuando sea necesario. 

2. Definir una función `marquesina` que, dado un objeto, la devuelve como un texto decorado en una caja. El, ancho, alto del relleno y el caracter de decoración son parámetros opcionales. Por ejemplo, dada `"Hola"`, devuelve

```
     *****************
     *      Hola     *
     *****************
```

<!-- 

 https://gist.githubusercontent.com/mgaitan/cb0ad9778453607acb49/raw/8d85d2184a4b46b48440cf5b5d95062801a08cce/baskara.py 

https://gist.githubusercontent.com/mgaitan/6319640/raw/8183dc5b214397f0ff2d38a25ebdd128a1a3ca0f/gistfile1.txt 
//-->

### Parámetros arbitrarios: `*args` y `**kwargs`

Hasta acá todo bonito. Pero ¿qué tal si quiero definir una función que acepte una cantidad arbitraria de parámetros? Acá vienen `*args` y `**kwargs`. Por ejemplo la función `zip` recibe una cantidad arbitraria de iteradores y devuelve tuplas con los i-elementos de cada una

In [None]:
list(zip((1, 2, 3), ('a', 'b', 'c'), ('alfa', 'beta', 'gama', 'theta')))

Entonces ¿cómo definiríamos una función al estilo  `zip` que recibe cuantos argumentos queramos?

In [None]:
def prod(*args):
    """
    calcula la productoria de todos los argumentos dados
    """
    
    # print(args)           # args es una tupla de los argumentos posicionales dados. 
    producto = 1
    for num in args:        
        producto *= num     # igual a producto = producto * num
    return producto

In [None]:
prod(3, 4, 2)

In [None]:
prod(10, 20, 2.1)

Por otro lado, tenemos como ejemplo el constructor `dict` que acepta una argumentos arbitrarios por clave para crear un diccionario

In [None]:
dict(Carlitos=10, Gaitán='Jugador Nº 12', Gonzales= 'no juega')

¿Cómo definir una función que permita esa flexibilidad? Eso se hace con `**kwarg`

In [None]:
def itemizar(**kwargs):
    """
    genera una lista de items con todos los argumentos dados
    """
    
    for clave, valor in kwargs.items():
        print('* {0} ({1})'.format(clave, valor))

In [None]:
itemizar(tornillos=10, lija=2, cualquiera=10, cosa=40)

En resúmen, con `*args` se indica *"mapear todos los argumentos posicionales no explícitos a una tupla llamada `args`"*. Y con `**kwargs` se indica "mapear todos los argumentos de palabra clave no explícitos a un diccionario llamado `kwargs`".

In [None]:
def f(a1,*args,**kwargs):
    print('a1=', a1)
    print('args=', args)
    print('kwargs=', kwargs)


In [None]:
f(4)   # solo definido el parámetro común a

In [None]:
f('valor', 1, 2)    # 'a1' y dos argumentos posicionales arbitrarios

In [None]:
f('2', 1, 2, color='azul', detallado=True)   # 



<div class="alert alert-warning">** NOTA **: No es necesario los nombres "args" y "kwargs", podemos llamarlas diferente, pero es una convención muy extendida. Estrictamente, los simbolos que indican cantidades arbitrarias de parametros son `*` y `**`. Además es posible poner parametros "comunes" antes de los parametros arbritarios.</div>






### La inversa: Desempacar secuencias o diccionarios directamente como argumentos

Si ya tengo los parámetros que quiero pasar a una función, los "desempaco". 


In [None]:
otra_data = ('hola', '¿cómo va?')

saludo, sufijo = otra_data

saludar('José', saludo, sufijo)   # el primer elemento desempacado, va al primer arg posicional disponible... 


In [None]:
saludar('José', *otra_data)

In [None]:
saludar??

In [None]:
mi_data = {'nombre': 'Cristian', 'saludo': 'Ey', 'sufijo': 'qué onda?', 'otra': 'color'}

saludar(**mi_data)

In [None]:
def saludar2(nombre, saludo="Hola", sufijo="¿qué tal?", **kwargs):
    """Dado un nombre y, opcionalmente, un saludo y/o sufijo, devuelve 
    una cadena saludo + nombre + sufijo"""
    
    return "{saludo} {nombre}, {sufijo}".format(**locals())  #la funcion locals() devuelve el diccionario de todos los objetos definidos en el espacio de nombres



In [None]:
saludar2(**mi_data)

Obviamente, si pasamos más parámetros de los esperados por la función (y no permite parámetros arbritrarios), dará un error

In [None]:
import this

In [None]:
this??

In [None]:
mi_data = {'nombre': 'Cristian', 'saludo': 'Ey', 'sufijo': 'qué onda', 'color': 'roja'}
saludar(**mi_data)

### Ejercicios

1. Dada las función `prod` y `marquesina` definidas con anterioridad, redefina `prod` agregando un parámetro opcional `enmamarcar` (`False` por defecto) que si es verdadero devuelve el resultado de la productoria en una marquesina. Cualquier otro parámetro se pasa directamente a la función marquesina. 

<!-- https://gist.githubusercontent.com/mgaitan/6bda75780aa826b45d09/raw/a1fb74873c98f4dff1b3689dae7246c490fb88ec/prod_enmarcable.py -->


### Argumentos *sólo por nombre*

La posibilidad pasar una cantidad arbitraria de argumentos, sea por posición o por nombre, es una ventaja que vuelve a Python muy poderoso. 

Una limitación que existía en Python 2 era que no se podían definir argumentos por nombre luego de un `*args`



In [None]:
%%python2   

# ese magic ^ ejecuta esta celda con python2
def f(*args, mayus=False):
    s = ' '.join(args)
    return s.upper() if mayus else s

f('hola', 'curso1', mayus=True)

In [None]:
def f(*args, mayus=False):
    s = ' '.join(args)
    return s.upper() if mayus else s

f('hola', 'curso!', mayus=True)

Obviamente, en ese caso la única forma de "setear" la opción `mayus` es a **explícitamente a través del nombre**, porque de otra manera el argumento sería capturado por la tupla de argumentos posicionales `*args`. 

Más aun, Python 3 también permite este tipo de **argumentos sólo por nombre** sin estar precedidos por argumentos variables y muchas veces son muy útiles. 



In [11]:
marquesina = lambda x: 10

def sumar(a, b, enmarcar=False):
    result = a + b
    if enmarcar:
        return marquesina(result)
    return result

print(sumar(1, 2, True))


10


In [12]:
sumar(1, 2, 3)  # bug

10

Se soluciona con un asterístico para avisar que **comienzan argumentos asignables sólo por nombre**

In [8]:
def sumar(a, b, *, enmarcar=False):
    result = a + b
    if enmarcar:
        return marquesina(result)
    return result

sumar(1,2,3)

TypeError: sumar() takes 2 positional arguments but 3 were given

In [None]:
print(sumar(1,2, enmarcar=True))

Despues de todo, explícito es mejor que implícito, ente otras cosas 

In [None]:
%%python3
import this

### Espacios de nombre y paso por asignación

Una función define un **espacio de nombre** (namespace), es decir, un contexto donde un nombre de variable refiere a un objeto unívoco dentro de ese espacio. Si un nombre no existe en el espacio de nombre local, se busca en el espacio global (módulo o sesión)


In [None]:
pi = 3.14

def area(r):
    return pi * r * r       # pi no está en en el espacio local, se usa el definido fuera de la función

r1 =1
area(r1)

In [None]:
pi = 3.14

def area2(r):
    return pi * r * r      # en este caso, se usa el pi pasado a la función

print(area2(1))
print(pi)                      # pero afuera sigue valiendo el del espacio global

tip: dentro de cualquier namespace, la función `locals()` devuelve el diccionario de nombres definidos

In [None]:
pi = 2
def namespaces(a, b):
    BLAH = 'bleh'
    print(locals())    

namespaces('1', b='algo')

En python se dice que los argumentos se pasan "por asignación", es decir, se asigna un nombre en el espacio de nombres local a un objeto existente, independientemente de si ya tiene un nombre en el espacio global.  Pero si ese objeto es mutable, la función podría modificar el objeto


In [None]:
def f2(l):
    l[0] = 10   
    return l


lista = ['a', 'b']
print(f2(lista))

In [None]:
def f3(l):
    l1 = l.copy()
    l1[0] = 10
    return l1


lista = ['a', 'b']
print(f3(lista))
lista

In [None]:
# pero se modificó el objeto fuera de la funcion
lista

En general, siempre es mejor que la funciones devuelvan objetos nuevos

In [None]:
def f2(l):
    return [10] + l[1:]

lista = ['a', 'b']
print(f2(lista))
lista


### Ejercicios 

* Una función puede retornar cualquier objeto y en Python todo es un objeto. Defina una [función de orden superior](https://es.wikipedia.org/wiki/Funci%C3%B3n_de_orden_superior) (función que devuelve funciones) llamada `lineal` que dados los coeficientes `a` y `b` devuelve $$f(x) = ax + b$$

* Mejorar la función anterior, generando un docstring dinámico para cada función devuelta indicando la función lineal específica que resuelve


<!-- https://gist.githubusercontent.com/mgaitan/a5fac459bf360f54d96e/raw/3b0d50048503399662cca97fb7c62025cdecb6cc/lineal_factory.py -->

## Generadores



Los generadores son similares a las funciones, pero permiten crear **una serie de resultados** para ser iterados (o sea, genera un iterador), devolviendo un valor por cada llamada. Ejemplos de funciones generadoras son `zip`, `enumerate`, `range` y `reversed`, que ya vimos. 

También mencionamos la versión por comprensión `(f(x) for x in iter)`. La forma funcional es casi igual a la las funciones comunes, pero en vez de `return` se utiliza `yield` que funciona como **una pausa** (devolviendo opcionalmente un valor) en la ejecución.


In [14]:
def generador_ejemplo():
    print('antes del primer yield')
    yield 1               # sale devolviendo. la proxima llamada comenzará en la siguiente linea
    print('antes del segundo')
    yield                 # como return, puede devolver None
    print('antes del último')
    yield 10
    print('final')

In [15]:
valores = generador_ejemplo()
valores

<generator object generador_ejemplo at 0x7fe6301ab888>

Para pedirles los valores uno a uno a un iterador (un generador es siempre un iterador), podemos usar la función `next`

In [None]:
next(valores)

In [None]:
next(valores)

In [None]:
next(valores)

In [None]:
next(valores)

Que es básicamente lo que hace la sentencia `for`

In [None]:
for valor in generador_ejemplo():
    print('Valor: ', valor)

La clave de un generador es que **no es necesario computar todos los valores posibles** de una serie, sino que los vamos creando uno a uno *bajo demanda*. Quizas antes de terminar la serie podemos dar por concluido el cómputo, y entonces habremos ahorrado tiempo de procesador y memoria. 

In [20]:
def fibonacci(n):
    """Generador de n primeros numeros de fibonacci"""
    i = 0
    a, b = 0, 1
    while i < n:
        i += 1
        yield a            # devolvemos un valor. En el proximo llamado retornará desde este punto, 
                           # con los valores de locals() tal como estaban antes de hacer el yield
        a, b = b, a + b

list(fibonacci(20))

[0,
 1,
 1,
 2,
 3,
 5,
 8,
 13,
 21,
 34,
 55,
 89,
 144,
 233,
 377,
 610,
 987,
 1597,
 2584,
 4181]

### Ejercicios

1. Defina un generador `encadenar` que recibe una cantidad arbitraria de iteradores como parámetros y encadena el último elemento de un iterador con el primero del siguiente. Por ejemplo `list(encadenar('BA', 'DC'))` devuelve `['B', 'A', 'D', 'C']`. 

<!-- https://gist.githubusercontent.com/mgaitan/2b11d202a6aec12994b7/raw/cb791ab0252f2cb24de0bf5fd9513ded6d01c3e8/encadenar.py 

o :-)

import itertools
itertools.chain

-->

## Manejo de excepciones

Ya vimos que a veces suceden errores: por ejemplo, cuando apuntamos a un elemento mayor al tamaño de una secuencia, cuando pedimos el valor de una clave que no existe en un diccionario, cuando dividimos por cero, cuando intentamos un *casting de tipos* no válido, etc. 

No hay problema interactivamente, porque podemos corregir y reintentar (lo que es genial), pero muchas veces queremos o necesitamos "capturar" el potencial error o excepción, ya sea para subsanarlo de alguna manera, registrarlo o lanzar otro más específico en reemplazo, etc. 
   
La sintaxis es un poco parecida al `if / elif / else`

In [None]:
int('diez')

In [None]:
while True:
    try:
        x = int(input("Ingrese un número entero: "))
        print("qué lindo número el {}".format(x))
        break
    except ValueError:
        print("Eso no es un número válido.")

Una sintaxis más completa permite multiples bloques `except`, un mismo bloque except  un bloque `else` que se ejecuta cuando no se originó ninguna excepción y un bloque `finally` que se ejecuta siempre

In [None]:

try:
    x = int(input("Ingrese el divisor: "))
    print(10/x)
except ZeroDivisionError:
    print("hubo un error de division por cero, obvio")
except ValueError:
    print("hubo un error de valor. Poné un numero! ")
else:
    print('todo salió bien. puedo hacer más operaciones')
finally:
    print('no sé qué pasó ni me interesa: yo me ejecuto igual')
    


¡Esto se usa mucho!  En la filosofía de Python, que espera comportamientos y no tipos,  es **mejor pedir perdón que pedir permiso**. Es decir, es preferible capturar potenciales errores de un intento de operación que verificar precondiciones. 
   
#### Ejercicio

1. Redefina el siguiente fragmento de código en una estructura `try / except`

```python
opciones = {'a': 'jugar', 'b': 'bailar', 'c': 'dormir siesta'}

opcion = input("Ingrese opcion ")
if opcion in opciones:
   print('Vamos a ', opciones[opcion])
else:
   print('Valor invalido')
```

<!-- https://gist.github.com/mgaitan/fbdb84b021151a545a36 -->

## Lectura y escritura de archivos

Siempre necesitamos leer y escribir archivos. Es la forma básica de interactuar con el resto del sistema, introducir y exportar datos para la "computación". Como en Python todo es un objeto, lo que tenemos es un "objeto manejador de archivos" . La forma más básica de obtener uno es con la función `open()` que se le dice la ruta al archivo y modo/s, que se especifican con 


       'r': lectura (default)
       'w': (sobre)escritura
       'a': agregar contenido al final 
       'x': para escribir, pero no sobreescribe si existe el path
       'b': modo binario
       't': modo texto (default)
       '+':	actualizar contenido
       



In [22]:
%%writefile archivo.txt
UN EJEMPLO DE TEXTO

CON MULTIPLES LINEAS

SI!

Overwriting archivo.txt


In [23]:
readme = open('archivo.txt')    # se usa modo default 'rt' (sólo lectura, formato texto)
print(readme)

<_io.TextIOWrapper name='archivo.txt' mode='r' encoding='UTF-8'>


Los objetos `file like` como `readme` tienen un método principal llamado `read` que lee `n` cantidad de caracteres (o bytes en modo binario) o todo el contenido del archivo si no se especifica

In [24]:
texto = readme.read()

texto

'UN EJEMPLO DE TEXTO\n\nCON MULTIPLES LINEAS\n\nSI!'

Atenti: el objeto manejador lleva internamente la **posición del cursor**. Por ejemplo, si invocan multiples veces el metodo `read()`, leerán porciones consecutivas del archivo. 

Métodos útiles: `read()`, `readlines()`, `write()`, `writelines()`

A veces simplemente queremos hacer algo "linea por linea". En vez de usar `readlines()` y cargar todo en memoria (que puede ser grande), podemos iterar directamente sobre el archivo, que nos devolverá una línea 

In [None]:
readme = open('archivo.txt')
for linea in readme:
    print(linea[:-1].upper())

In [None]:
readme = open('README.rst')
for i, linea in enumerate(readme):
    if i < 4:
        print(linea)
    else:
        break

In [None]:
readme2 = open('archivo.txt', 'r')

print("".join(readme2.readlines()))


Hasta que no se invoca al método `close()` el archivo está manejado en memoria por Python (y puede causar conflictos si queremos abrir el archivo desde otro programa). Como los objetos `file` saben usar un bloque `with` (manejador de contexto), podemos usarlo para que se cierre automáticamente. 

In [None]:
with open('README.rst', 'r') as readme:
    lineas = readme.readlines()[0:5]    #mete las líneas en una lista
print(''.join(lineas))


### Ejercicio:

1. Escriba una función que, dada la ruta de un archivo de texto, escriba otro archivo con igual nombre pero precedido por el prefijo `"upper_"` cuyo contenido es el del original, todo convertido a mayúsculas
<!-- https://gist.githubusercontent.com/mgaitan/2c991ea473a8d8c4ab32/raw/3a39cb083a614952bf8ee93ff9f8c4fa2f56784c/convertidor.py -->