<img src="CIDaeNNB.png" alt="Logo CiDAEN" align="right">


<br><br><br>
<h1><font color="#00586D" size=5>Módulo 1</font></h1>



<h1><font color="#00586D" size=6>Python - Tutorial III</font></h1>

<br>
<div style="text-align: right">
<font color="#00586D" size=3>Javier Cózar</font><br>
<font color="#00586D" size=3>Máster en Ciencia de Datos y Desarrollo de Aplicaciones en la Nube</font><br>
<font color="#00586D" size=3>Universidad de Castilla-La Mancha</font>

</div>

<h2><font color="#00586D" size=5>Índice</font></h2>

---

El objetivo de este tutorial es aspectos más específicos de python como los ámbitos, así como funcionalidades habituales en cualquier lenguaje de programación (paquetes, ficheros y clases).


A modo de **índice**, en este tutorial se verán:


* 1. Paquetes y módulos: importar
* 2. Ámbitos de declaración (global y local)
  * 2.1 Global y local
  * 2.2 Palabra reservada global
* 3. Ficheros
* 4. Contextos
* 5. Pickle: Serialización de objetos
* 6. Clases y objetos
  * 6.1 Herencia

---

<h1><font color="#00586D" size=5>1. Paquetes y módulos: importar </font></h1>

En el _Tutorial python I_ ya introdujimos cómo importar módulos (`import math`).

Los módulos son ficheros en python. Los módulos pueden ser importados, haciendo su código accesible: por ejemplo `modulo.atributo`.

Para cargar un módulo se usa la sentencia `import` seguido del nombre del paquete. Se creará una variable cuyo nombre es el nombre del paquete, y podremos acceder a su contenido con el punto: por ejemplo `math.pi`.

Si queremos que la variable para acceder al paquete tenga otro nombre, se puede elegir añadiendo `as nuevo_nombre` después del import: `import math as mt`

In [None]:
import math

In [None]:
math.pi

<div class="alert alert-block alert-info">
<i class="fa fa-info-circle" aria-hidden="true"></i>
Los paquetes son directorios que contienen uno o más módulos (u otros paquetes). Además, cada paquete debe contener un módulo con un nombre especial: <i>__init__.py</i>. Este fichero especial contiene el código que será ejecutado cuando el paquete se importe por primera vez en el intérprete.
</div>

<div class="alert alert-block alert-info">
<i class="fa fa-info-circle" aria-hidden="true"></i>
Además de import, existen otras formas de importar módulos y paquetes. Los más importantes son tres:


- `import` (el mostrado anteriormente)
- `from módulo import elemento as nombre` (donde `as nombre` es opcional)
- Uso del paquete `importlib`: permite un mayor control a la hora de importar módulos y paquetes. Uno de los ejemplos es el importar mediante el uso de strings: `importlib.import_module('random')`.

</div>

In [None]:
"""
En este ejemplo utilizaremos el módulo random para generar números aleatorios.
"""
import random  # importamos el módulo
import numpy as np  # si no tenemos insyalado numpy, instalarlo ahora
numeros_aleatorios = []
a, b = 0, 10
N = 10000000
for _ in range(N):
    numeros_aleatorios.append(random.randint(a, b))

# Obtenemos estadísticas de sobre la lista de números aleatorios generada

print("La media +- desviación típica es: {} +- {}.".format(
    np.mean(numeros_aleatorios), np.std(numeros_aleatorios)))


In [None]:
# Utilizando from
import random  # importamos el módulo
from numpy import mean, std
numeros_aleatorios = []
a, b = 0, 10
N = 1000
for _ in range(N):
    numeros_aleatorios.append(random.randint(a, b))

# Obtenemos estadísticas de sobre la lista de números aleatorios generada

print("La media +- desviación típoca es: {} +- {}.".format(
    mean(numeros_aleatorios), std(numeros_aleatorios)))


<div class="alert alert-block alert-info">
<i class="fa fa-info-circle" aria-hidden="true"></i>
<strong>Nota</strong>: Sobre todo si no estás habituado a programar en python, es muy recomendable utilizar únicamente `import`. De esta manera, es más dificil cometer errores en el nombrado de variables y machacar paquetes importados (en ese caso, habría que volver a realizar el import para acceder a los módulos / paquetes).

<div class="alert alert-block alert-warning">
<i class="fa fa-info-circle" aria-hidden="true"></i>
<strong>Nota</strong>: Al usar from, se puede utilizar el asterisco, importando todo lo que hay dentro del paquete. Sin embargo esta práctica está desaconsejada por perder todalmente la visibilidad de los elementos importados.

<h1><font color="#00586D" size=5>2. Ámbitos de declaración</font></h1>

Hasta ahora no nos hemos preocupado del **ámbito de declaración** de las variables y funciones. En cualquier parte del código podemos crear una nueva variable con tan solo realizar una asignación, _¿pero es visible desde todo el código?_

Por ejemplo:

In [None]:
fuera_de_funcion = "Texto"

def mi_funcion():
    print(fuera_de_funcion)

mi_funcion()  # ¿Funcionará? Sí, accede a la variable global

In [None]:
def mi_funcion():
    print(fuera_de_funcion)

fuera_de_funcion = "Texto"

mi_funcion()  # ¿Funcionará? Sí, accede a la variable global (no importa el orden del código, importa el de ejecución)

In [None]:
def mi_funcion():
    dentro_de_funcion = "Texto"

mi_funcion()
# Devuelve error
print(dentro_de_funcion)  # ¿Funcionará? No. La función está declarada dentro de mi_funcion (ámbito local a la función)

In [None]:
def fn():
    for i in [4, 5, 6]:
        print(i)
    print("=======")
    print(i)
    print("=======")
    print(locals())
    print("=======")

In [None]:
fn()

En el ultimo ejemplo, la variable ha sido declarada dentro de una función, cuyo ámbito es local a la función. **¡Es decir, la variable solo es visible mientras la función se está ejecutando!**

<font color="#00586D" size=4> 2.1 Global y local  </font>

En python existen dos ámbitos:
* Local
* Global

Todo lo que se declare **en el cuerpo del módulo principal** se declara como **global** (_en las libretas, cualquier celda se considera cuerpo del módulo principal, por lo que en general trabajaremos con variables globales_).

En todo momento podemos consultar la lista de declaraciones globales y locales mediante las funciones built-in `globals` y `locals`.

**El resto se declara como local** al ámbito de donde se esté ejecutando (función, objeto, módulo, ...).

In [None]:
def mi_funcion():
    dentro_de_funcion = "Texto"
    print("Éstos son los elementos de ámbito local: {}\n".format(locals()))

mi_funcion()

print("Fuera de la función éstos son los elementos de ámbito locales: {}\n".format(locals()))

print("Que son los mismos que los elementos de ámbito global: {}\n".format(globals()))

<font size=4> <i class="fa fa-book" aria-hidden="true" style="color:#00586D"></i> </font> __Importante!__ Podemos definir funciones dentro de funciones. Lo que tendríamos es un ámbito local dentro de otro ámbito local. Esto se gestiona con una jerarquía de ámbitos locales. Es decir, si tenemos `funcion1`, y dentro del ámbito de esta función definimos `funcion2`, lo que declaremos en `funcion1` será visible para `funcion1` (a no ser que `funcion2`declare una variable con el mismo nombre, en cuyo caso existirán dos variables (con el mismo nombre) pero en distintos ámbitos locales. Ejemplo:

In [None]:
def funcion1():
    def funcion2():
        # La variable no existe en el ámbito local de funcion2, pero se eonctrará en el ámbito de funcion1 (padre).
        print(variable)
    variable = "Desde funcion1"
    funcion2()
    print(variable)
funcion1()

In [None]:
def funcion1():
    def funcion2():
        # Se define variable en este ámbito. Será la que se use.
        variable = "Desde funcion2"
        print(variable)
    # ¡Pero no sobreescribirá a esta! Convivirán las dos versiones, en distintos ámbitos locales.
    variable = "Desde funcion1"
    funcion2()
    print(variable)
funcion1()

<font color="#00586D" size=4> 2.2 Uso de la palabra reservada `global` </font>


<font size=4> <i class="fa fa-book" aria-hidden="true" style="color:#00586D"></i> </font> __Importante!__ Cuando vamos a declarar una variable o función, por defecto intentará crearla en ámbito local (si ya existe en este ámbito tan solo asignará el valor correspondiente). Si queremos que se declare como global, o si ya existe como global pero queremos actualizar su valor, es necesario el uso de la `global`. Esta sentencia `global nombre_variable` debe realizarse al principio del scope correspondiente (función, clase, ...)

In [None]:
def mi_funcion():
    global dentro_de_funcion
    dentro_de_funcion = "Texto"
    print("Éstos son los elementos de ámbito local: {}".format(locals()))

mi_funcion()
print(dentro_de_funcion)  # ¿Funcionará?

In [None]:
def asigna_5():
    x = 5

x = 10
asigna_5()
print(x)  # ¿Qué valor imprimirá?

In [None]:
def asigna_5():
    global x
    x = 5

x = 10
asigna_5()
print(x)  # ¿Qué valor imprimirá?

<font size=4> <i class="fa fa-book" aria-hidden="true" style="color:#00586D"></i> </font> __Importante!__ Si no tenemos cuidado con el nombrado de variables y funciones, podemos equivocarnos y machacar elementos por error.


<h3><font color="#00586D" size=4><i class="fa fa-pencil-square-o" aria-hidden="true"></i>Ejercicio</font></h3>

**En este ejericio, con el fin de habituarnos a los scopes en python, declararemos:**

* Una función, llamada `lista_aleatoria` (sin parámetros) que use una variable global llamada `N` (declararla en ámbito global, es decir, en la celda fuera de declaración de la función) para:
  * Crear una lista de `N` números aleatorios (utilizar la función `random()` del módulo `random` para generar **un número aleatorio** entre 0 y 1).
  * Incrementa el valor de `N` en 1, de tal manera que la siguiente vez que se llame a la función esta lista será más grande.

In [None]:
# Completar

<h3><font color="#00586D" size=4><i class="fa fa-pencil-square-o" aria-hidden="true"></i>Ejercicio</font></h3>

El paquete `time` se puede usar para devolver el timestamp actual (segundos transcurridos desde 01-01-1970). Vamos a:

- Declarar una función llamada `total_seconds`, inicialmente con valor 0.
- Implementar una función que reciba un parámetro `n`, e itere en un bucle ese número de veces y nos pida en cada uno introducir por teclado una palabra, las cuales serán introducidas en una lista. La función devolverá esa lista.
- Implementar una segunda función que reciba como argumento esta lista y calcule la longitud media de las palabras en la misma, y devuelva dicho valor.
- Cada una de las dos funciones debe incrementar el valor de `total_seconds` de acuerdo al tiempo empleado. Para ello, usar `time.time()` al inicio y al final de la función, siendo el tiempo transcurrido la diferencia entre el segundo y el primer caso.
- Finalmente, invocar ambas funciones e imprimir el valor devuelto por la última así como el tiempo empleado.

<h1><font color="#00586D" size=5>3. Ficheros </font></h1>

Como en cualquier lenguaje de programación, los ficheros se manejan en dos fases:

- Primero se obtiene el descriptor del fichero. Éste es un objeto que permite efectuar operaciones de entrada / salida sobre el fichero. Se crea con la llamada `open`.
- Sobre el descriptor se pueden efectuar operaciones de lectura (función `read`) y escritura (función `write`). La función `open` debe ser correctamente parametrizada para poder efectuar correctamente estas operaciones.

Hay que recordar cerrar el fichero una vez éste ha sido utilizado. Para ello, se usa la función `close`.

In [None]:
# Crear un fichero llamado fichero.txt usando la interfaz de jupyter
# Abre el fichero
file = open('fichero.txt')
# Lee el contenido
texto = file.read()
print(texto)

# Si usamos la función read otra vez, nos devolvera la cadena vacía porque ya ha sido leido!

# Cerramos el descriptor del fichero
file.close()

In [None]:
file = open('fichero.txt', 'w')
file.write('Nuevo texto')
# Cerramos el descriptor del fichero
file.close()

In [None]:
file = open('fichero.txt')
texto = file.read()
print(texto)

Para escribir el fichero, hemos utilizado un segundo parámetro en la función `write`. Este parámetro indica de qué forma se debe abrir el fichero. Los modos en los que se puede abrir un fichero son _(se pueden combinar dos letras para elegir modo texto o binario, por ejemplo 'rb' para leer en binario)_:


| Carácter | Significado|
|------|------|
| 'r' | en modo lectura (por defecto)| 
| 'w' | en modo escritura (primero vacía el fichero)| 
| 'x' | en modo escritura, pero lanza una excepción si el fichero ya existe | 
| 'a' | en modo escritura, pero no vacía el fichero. Lo que se escribe, se pone al final | 
| '+' | en modo actualización (permite leer y escribir) | 
| 'b' | modo binario | 
| 't' | modo texto (por defecto)| 

<font color="#00586D" size=5>4. Contextos </font>

En el ejemplo anterior, hay que recordar siempre cerrar el descriptor del fichero. En caso contrario, podrían producirse efectos no deseados.

Los contextos delimitan un bloque con unas características que lo describen. Por ejemplo, un bloque contextual para leer un fichero comienza con la apertura del descriptor y termina con el cierre del mismo. En Python, ésto se realiza mediante la palabra reservada `with`:

In [None]:
with open('fichero.txt') as f:
    texto = f.read()

# En este punto el fichero ya ha sido cerrado! (se ha invocado la función close)
print(texto)

Existen otras utilidades, como abrir una **conexión a una base de datos**, una **conexión a un web socket**, etc. La instrucción situada tras la palabra `with` debe devolver un objeto con dos funciones implementadas:

- `__enter__`: Se llama al principio del bloque
- `__exit__`: Se llama al final del bloque

In [None]:
import requests  # instalar si no está instalado
url_quijote = "https://gist.githubusercontent.com/jsdario/6d6c69398cb0c73111e49f1218960f79/raw/8d4fc4548d437e2a7203a5aeeace5477f598827d/el_quijote.txt"
text_quijote = requests.get(url_quijote).text

<h3><font color="#00586D" size=4><i class="fa fa-pencil-square-o" aria-hidden="true"></i>Ejercicio</font></h3>

Usando contextos, escribir el texto en un fichero llamado quijote.txt.

In [None]:
# Completar

<h3><font color="#00586D" size=4><i class="fa fa-pencil-square-o" aria-hidden="true"></i>Ejercicio</font></h3>

Usando contextos, leer el contenido del fichero llamado quijote.txt y calcular cuántas palaabras tiene. ¿Y cuántas palabras distintas?

In [None]:
# Completar

<font color="#00586D" size=5>5. Pickle: Serialización de objetos </font>

A lo largo del curso veremos procesos de cierta entidad que requieren tiempo para poder ejecutarse (por ejemplo, generar una tabla de datos). Si cerramos jupyter, perderemos todas nuestras variables y funciones, teniendo que volver a ejecutar el código. En estos casos, puede ser de utilidad almacenar en un fichero la estructura de datos deseada (por ejemplo, la tabla anteriormente mencionada).

`pickle` es un módulo que permite **serializar objetos** de Python para almacenarlos en un fichero, pudiendo recuperarlos cuando sea necesario. Existen ciertas propiedades que tienen que cumplir los objetos para que puedan ser serializados por `pickle`, pero la gran mayoria de elementos que usaremos pueden ser serializados. Existen 4 funciones, dos para leer y 2 para escribir un objeto pickle (por convenio, con extensión 'pkl'):

- pickle.load
- pickle.loads
- pickle.dump
- pickle.dumps

`load(s)` sirve para leer un fichero pickle, mientras que `dump(s)` sirve para serializar un objeto. La diferencia entre `load` y `loads` (al igual que entre `dump` y `dumps`) es que trabaja sobre un string binario o sobre un descriptor de fichero.

In [None]:
import pickle

l = list(range(1000))
with open('mypickle.pkl', 'wb') as f:
    pickle.dump(l, f)
    
with open('mypickle.pkl', 'rb') as f:
    l2 = pickle.load(f)

l == l2

In [None]:
import pickle

l = list(range(1000))
with open('mypickle.pkl', 'wb') as f:
    f.write(pickle.dumps(l))
    
with open('mypickle.pkl', 'rb') as f:
    l2 = pickle.loads(f.read())

l == l2

<font color="#00586D" size=5> 6. Clases y objetos</font>

Aunque no es un aspecto clave para este curso, en ocasiones el uso de clases puede ser **muy útil**, por lo que es recomendable saber lo básico de la _programación orientada a objetos_.

Una clase es una definición que consiste en una colección de **variables** y **métodos** (funciones). Un objeto es una **instanciación** de esa clase, es decir, un objeto que contiene esas variables y funciones. La clase es la receta (solo definición), mientras que el objeto es algo manipulable (podemos llamar a sus funciones, sus atributos, etc.)

Dos objetos creados a partir de la misma clase son completamente **independientes**. Para referirse al propio objeto dentro de la definición de las clases, se usa (_por convenio_) la variable `self`.

La definición de clases se hace con la palabra reservada `class`. Existe una función que será ejecutada siempre que un objeto se cree a partir de la clase, llamada `__init__`. En una clase, toda función tiene como primer parámetro un argumento llamado `self` (salvo si se usa el decorador @staticmethod: más información [aquí](https://docs.python.org/3/library/functions.html#staticmethod)). Como mencionamos antes, este parámetro permite referenciar al propio objeto dentro de la definición de la clase. Para ver información más detallada sobre las clases, y propiedades como la _herencia_, consultar [aquí](https://docs.python.org/3.6/tutorial/classes.html).

Para crear un objeto a partir de una clase, se usa la misma sintaxis que en la llamada a funciones. De hecho, es como llamar a la función `__init__`, omitiendo el primer parámetro `self` y el nombre de la función (`__init__`):

In [None]:
class MiClase:
    def __init__(self, x):
        self.x = x
        print("¡Objeto creado!")

mi_objeto = MiClase(5)

In [None]:
mi_objeto.x

<div class="alert alert-block alert-info">
<i class="fa fa-info-circle" aria-hidden="true"></i>
    Cuando se define una clase, la función <i>__init__</i> existe por defecto, como una función vacía y sin argumentos (únicamente el self).
</div>

In [None]:
class MiClase:
    pass # La palabra reservada 'pass' indica que es una sentencia que no hace nada.
         # Sirve para evitar fallos de sintáxis (como ahora, definir una clase sin nada dentro).
mi_objeto = MiClase()

In [None]:
# Podemos definir una clase con una función
class MiClase:
    def saludar(self):
        print("¡Hola!")
mi_objeto = MiClase()
mi_objeto.saludar()  # Invocamos la función saludar del objeto

<font size=4> <i class="fa fa-book" aria-hidden="true" style="color:#00586D"></i> </font> __Importante!__ En el ejemplo a continuación es necesario realizar la asignación `self.nombre = nombre` para que el nombre se guarde en el objeto. Si no, sería una variable declarada en el ámbito de la función que se perdería en cuanto finalizase la ejecución de la misma.

In [None]:
# Podemos definir una clase con una función y una variable, que además se inicializa en el __init__
class MiClase:
    def __init__(self, nombre):
        self.nombre = nombre # Es necesario 
    def saludar(self):
        print("¡Hola {}!".format(self.nombre))
mi_objeto = MiClase("Javi")
mi_objeto.saludar()  # Invocamos la función saludar del objeto

# Podemos acceder a los atributos (variables almacenadas en self)
print(mi_objeto.nombre)


<font color="#00586D" size=5> <strong>Herencia</strong> </font>

Al declarar una clase, es posible heredar funcionalidad declarada en otra definición de clase. Esto es útil si queremos extender la funcionalidad de una clase ya implementada, o incluso para definición de clases como _interfaces_.

In [None]:
from pprint import pprint
class Tabla:
    def __init__(self, columns):
        self.columns = columns
        self.data = []

    def add_row(self, row):
        dict_row = { c: field for c, field in zip(self.columns, row)}
        self.data.append(dict_row)
    
    def show(self):
        pprint(self.columns)
        pprint("=" * 20)
        pprint(self.data)

t = Tabla(['Nombre', 'Dirección', 'Teléfono'])
t.add_row(['Javier', 'C/ Falsa 123', 666667788])
t.add_row(['Juan', 'C/ Más Falsa 123', 666778899])
t.show()

In [None]:
class TablaAlimentos(Tabla):
    def __init__(self):
        super().__init__(['Alimento', 'Calorías'])

    def add_row(self, alimento, calorias):
        super().add_row([alimento, calorias])
    
    def info(self):
        print("Esta tabla describe alimentos y cuántas calorías tienen.")

t = TablaAlimentos()
t.add_row('manzana', 52)
t.add_row('lechuga', 15)
t.show()
t.info()

<h3><font color="#00586D" size=4><i class="fa fa-pencil-square-o" aria-hidden="true"></i>Ejercicio</font></h3>

- Implementar una clase Persona que contenga los atributos nombre, edad y salario (estos valores deben inicializarse en el constructor). Crear una función llamada `get_salario` que en función de la edad multiplique el salario base por un factor y devuelva el nuevo número:
    - *0.5 si tiene menos de 20 años
    - *0.8 si tiene menos de 40 años
    - *1.2 si tiene menos de 60 años
    - *0.75 en caso contrario

- Implementar una clase Matrimonio que contenga dos personas como atributos, y que sobreescriba la función `get_salario` sumando los salarios de ambas personas.

In [None]:
# Completar