# Taller Python Sesión 2

# Máquinas Virtuales

## Instalación

Ejemplo de Máquina Virtual con Parallels Desktop:

![Python Terminal](https://drive.google.com/uc?export=view&id=161kb1GV5uLcoyJA0hzcBoIVuuLwpQo0_)

**Máquinas Virtuales**

Estos son los clientes para máquinas virtuales más famosos, algunos son exclusivos de un sistema operativo determinado, el más elemental y extendido es Virtualbox pero hay otros contenidentes muy interesantes:



*   [Virtual Box](https://www.virtualbox.org/) - Más extendido y robusto, pero interfaz muy antigua y poco amigable
*   [VMware Workstation](https://www.vmware.com/products/workstation-player/workstation-player-evaluation.html) - Alternativa muy popular a Virtual Box para Linux y Windows
*   [VMware Fusion](https://www.vmware.com/products/fusion.html) - Versión de VMware para macOS
*   [Parallels Desktop](https://www.parallels.com/eu/products/desktop/) - Solo macOS, muy optimizado
*   [QEMU](https://www.qemu.org/) - Proyecto Open Source para virtualizar



**Contenedores**



*   [Docker CE](https://docs.docker.com/install/) - Docker CE es la versión gratuita que cubre todas las necesidades indivuales sobre un contenedor.
*   [Docker Compose](https://docs.docker.com/compose/install/) - Docker Compose es una herramienta para definir y orquestar la ejecución de múltiples aplicaciones Docker.
*   [Kubernetes](https://kubernetes.io) - Kubernetes es un sistema que permite definir y orquestar la ejecución de múltiples contenedores (similar, pero con diferencias entre Docker Swarm).


# Funciones

Una función es un bloque organizado de código reutilizable. Las funciones otorgan  modularidad a una aplicación y un nivel de reusabilidad. Hay varios consejos que debe seguir una función:



*   Las funciones deben ser lo más nucleares posibles: Una función debe realizar una sola tarea con un objetivo claro
*   Cualquier código que se repita en tu programa es candidato de convertirse en una función.
*   Las funciones deben ser descriptivas en su funcionamiento: El nombre de la función debe  dar una descripción aproximada de su funcionamiento.



**Definición**

Una función se define con la siguiente sintaxis en Python:


1.   Los bloques de una función empiezan con la palabra reservada **def** seguida de paréntesis.
2.   Cualquier parámetro o argumento debe declararse dentro de los paréntesis.
3.   El bloque de la función se separa con los dos puntos **" : "** seguido de una identación.
4.   La palabra rservada **return** termina la ejecución de una función devolviendo opcionalmente un valor.



In [None]:
def function_example(parameter):
  """DocSttring"""
  print(parameter)
  return

Aquí podemos ver un ejemplo de función, tiene un Docstring, que es documentación acerca de la función y sus parámetros, el cuerpo donde se ejecuta el código y luego la llamada de **return** para salir de la función.
A partir de aquí una función podrá ser ejecutada tantas veces como se quiera al invocar una llamada a la función.

In [None]:
function_example("Hola Mundo")

Hola Mundo


Se puede realizar tantas llamadas como sea necesario, cambiando el valor de los parámetros cuando se quiera.

In [None]:
function_example("Que tal estás")

Que tal estás


## Parámetros por valor o por referencia


Todos los parámetros en Python se pasan por referencia. Esto significa que si cambias el valor dentro de una función también cambiará fuera de ella, y es un error muy común que se comete en programación.

Visualmente se puede diferenciar el paso de parámetros de valor y de referencia con este gif:

![Value vs referenc](https://www.mathwarehouse.com/programming/images/pass-by-reference-vs-pass-by-value-animation.gif)

Como podemos observar, al pasar por referencia, si cambiamos el valor interno en la función cambiará en la variable externa, en cambio si la cambiamos al pasar la variable por valor no cambia en la variable externa.

Esto se puede ver también en código:

In [None]:
def empty_list(list):
  list.clear()
  print(f"Dentro de empty_list: {list}")

In [None]:
# Reference
list_reference = [1,2,3]
print(list_reference)
empty_list(list_reference)
print(list_reference)

[1, 2, 3]
Dentro de empty_list: []
[]


In [None]:
# Value
list_value = [1,2,3]
print(list_value)
empty_list(list_value.copy())
print(list_value)

[1, 2, 3]
Dentro de empty_list: []
[1, 2, 3]


## Parámetros


En Python pueden utilizarse cuatro tipos de argumentos en una función:



1.   Argumentos obligatorios
2.   Argumentos por clave
3.   Argumentos por defecto
4.   Argumentos de longitud variable (simples o con clave/valor)

Cada uno de ellos tiene una propiedad diferente.


**Argumentos obligatorios**

Los argumentos obligatorios son aquellos que se pasan a una función en el orden correcto y con el número exacto de variables para argumentos.

In [None]:
def required_args(first, second, third):
  print(first)
  print(second)
  print(third)
  
required_args("first", "2", "third")

first
2
third


In [None]:
# Will fail
required_args()

TypeError: ignored

**Argumentos por clave**

En python también puedes referenciar a un argumento por su nombre, pudiendo así cambiar el orden de llamada.

In [None]:
def keyword_args(first, second, third):
  print(first)
  print(second)
  print(third)

keyword_args(first="first", third="third", second="second")

first
second
third


**Argumentos por defecto**

Un argumento por defecto es un argumento que asume su valor por defecto, estos argumentos siempre van después de los argumentos por clave y pueden ser omitidos en la llamada a la función.

In [None]:
def default_args(first, second, third="third", fourht="4"):
  print(first)
  print(second)
  print(third)
  print(fourht)
  print("========")

# You can call the third value
default_args("first", "second", "3")

# You can ommit the value
default_args("first", "2")

# You can change the default value
default_args("first", "second", fourht="other")

first
second
3
4
first
2
third
4
first
second
third
other


In [None]:
default_args("first")

TypeError: ignored

**Argumentos de longitud variable**

En algunas funciones encontraréis los parámetros \*args y \*\*kwargs. Estas son palabras reservadas que al principio es difícil de comprender. Lo primero de todo es que el nombre args y kwargs no es necesario, solo los asteriscos, pero por convenio se usan esas palabras, se podría tener \*var y \*\*vars pero no suele ser muy usual.

Estas palabras se utilizan para pasar una cantidad variable de argumentos a una función sin saber con exactitud la cantidad exacta. En el caso de \*args podemos ver su función en esta función:


In [None]:
def test_var_args(f_arg, *argv):
    print(f"first normal arg: {f_arg}")
    print(argv)
    for arg in argv:
        print(f"another arg through *argv : {arg}")

test_var_args('lucas','python','ML','test', 'asdfafds')

first normal arg: lucas
('python', 'ML', 'test', 'asdfafds')
another arg through *argv : python
another arg through *argv : ML
another arg through *argv : test
another arg through *argv : asdfafds


In [None]:
def multiply(*args):
    z = 1
    for num in args:
        z *= num
    print(z)

multiply(4, 5)
multiply(10, 9)
multiply(2, 3, 4)
multiply(3, 5, 10, 6)
multiply(3, 5, 10, 6, 34, 23, 34)

Por otra parte \*\*kwargs se usa para pasar parámetros de longitud variable con clave, esto puede usarse con múltiples fines, como por ejemplo para ejecutar instrucciones como una CLI.

In [None]:
def greet_me(**kwargs):
    if kwargs is not None:
        print(kwargs)
        for key, value in kwargs.items():
            print(f"{key} --> {value}")
 
greet_me(name="lucas", language="python", area="ML", context="test", country="spain")
print("=============")
greet_me(name="lucas", language="python", area="ML", context="test", country="spain", month="June")


{'name': 'lucas', 'language': 'python', 'area': 'ML', 'context': 'test', 'country': 'spain'}
name --> lucas
language --> python
area --> ML
context --> test
country --> spain
{'name': 'lucas', 'language': 'python', 'area': 'ML', 'context': 'test', 'country': 'spain', 'month': 'June'}
name --> lucas
language --> python
area --> ML
context --> test
country --> spain
month --> June


## Return

La palabra reservada **return** sirve para terminar una función y devolver una expresión a la linea de código que la ha llamado. Una función sin **return** es lo mismo que si devuelve None.

Puede devolverse cualquier valor, y como mencionamos en el curso anterior, pueden **devolverse múltiple valores mediante tuplas.**

In [None]:
def simple_sum(a, b):
  return a + b

result = simple_sum(4, 2)
print(result)

def return_none(a, b):
  a + b
result = return_none(2,3)
print(result)


def increment_two_values(a, b):
  a += 1
  b += 1
  return a, b

inc_1, inc_2 = increment_two_values(3, 5)
print(f"{inc_1} and {inc_2}")


6
None
4 and 6


## Variables globales vs Variable locales

**Variables globales vs. Variables Locales**

Todas las variables tienen un ámbito que puede depender de donde ha sido declarada una variable, así pueden existir variables globales, locales y contenidas. Esto se puede ver bien en el gráfico:

![Scope](https://sebastianraschka.com/images/blog/2014/scope_resolution_legb_rule/scope_resolution_1.png)


Sacando un ejemplo práctico podemos ver:

In [None]:
a_var = 'global value'
print(a_var)

def outer():
       a_var = 'local value'
       print('outer before:', a_var)
       def inner():
           nonlocal a_var
           a_var = 'inner value'
           print('in inner():', a_var)
       inner()
       print("outer after:", a_var)
outer()

print(a_var)

global value
outer before: local value
in inner(): inner value
outer after: inner value
global value


## Funciones Avanzadas

Vamos a entrar en un terreno más complicado y menos intuitivo. Aunque la sintaxis es sencilla una vez dominas el concepto puede que sea difícil entender la intencionalidad de las funciones lambda y anónimas.

Hay que incidir en que este concepto se usa mucho en *Data Science* y hay muchos modelos de tensorflow que toman funciones anónimas como argumentos de otras para ejecutar una serie de pasos.

Por ello es importante conocer al menos un poco de su funcionamiento y su finalidad

### Funciones anónimas (Lambda)




Las funciones anónimas se llaman así ya que no se declaran con la palabra reservada **def**. No necesitan identación para declarar la funcionalidad y tienen una serie de características que las hacen muy especiales:



*   Utilizan la palabra reservada **lambda** para declararse
*   Pueden tener múltiples argumentos pero solo pueden devolver  un valor por expresión
*   Una función anónima no puede llamarse directamente, ya que **lambda** necesita una expresión.
*   Las funciones lambda tienen su propio *namespace* y no pueden acceder variables otras que las pasadas por argumentos.

La sintaxis de una función lambda sería la siguiente:



```
lambda [arg1, arg2....]:expresion
```


Para comprender como funciona una función lambda primero vamos a ver una función sencilla:

In [None]:
def cube(x):
  return x*x*x

res = cube(7)
print(res)

343


Ahora vamos a representar esta misma función mediante **lambda**:

In [None]:
cub = lambda x: x*x*x
res = cub(7)
print(res)

343


Como podemos observar la diferencia principal es que en una función estándar necesitamos declarar un nombre de función al que tendremos que referenciar cada vez que queramos ejecutar una función. Con **lambda** tendremos una función anónima que podremos asignar a una variable para ejecutarla posteriormente.

Ahora vamos a ver la verdadera potencia de las funciones anónimas, cuando usamos métodos de listas como **filter o map** usaremos **lambda** para poder declarar las transformaciones de una forma muy elegante.
Así, si queremos un programa que elimine los números impares de una lista pasaremos de esto:

In [None]:
li = [5, 7, 22, 97, 54, 62, 77, 23, 73, 61] 
def filter_list(lis):
  new_list = []
  for element in lis:
    if(element%2 != 0):
      new_list.append(element)
  return new_list

li_filtered = filter_list(li)
print(li_filtered)

A una solución mucho más sencilla de leer:

In [None]:
li = [5, 7, 22, 97, 54, 62, 77, 23, 73, 61] 
li_filtered = list(filter(lambda x: (x%2 != 0), li)) # return lazy iterator convert to list
print(li_filtered)

Esta serie de operaciones, que pueden involucrar transformación, reducción o filtrado de matrices son esenciales en *Data Science* además, introducen una nueva dimensionalidad de **sintactic sugar** que permite al programador hacer más escribiendo menos.

# Gestión de módulos

Un módulo permite organizar de forma lógica el código en Python. A medida que va aumentando en complejidad el proyecto las líneas de código pueden crecer a un ritmo exponencial. Python no obliga al desarrollador a mantener el código separado, siempre puedes tener todo tu código recogido en un solo fichero, pero este se hace inpracticable  en un momento determinado.

Para solucionar este problema existen los módulos. Un módulo es un fichero Python donde se pueden definir funciones, claes y variables que puedes referenciar y añadir a otro código.

Este código puede importarse usando la palabra reservada **import** o **from** con el siguiente formato:



```
import module1, module2.....
from module1 import [reference]
```



In [None]:
# Import module
import time

# call module by callint it's name
seconds = time.time()

print(seconds)

Por otro lado, con la notación **from ... import** podemos importar atributos específicos de un módulo al *namespace* actual.

In [None]:
from time import time

seconds = time()

print(seconds)

Cuando el interprete se encuentra la palabra reservada **import**, busca en la ruta declarada (puede ser relativa o absoluta) el fichero con el nombre declarado. Este fichero, al ser declarado se buscará en las siguientes secuencias hasta que se encuentre:



*   En el directorio actual.
*   Si no se encuentra en el directorio actual, Python busca en todos los directorios correspondientes a la variable de entorno PYTHONPATH.
*   Si todo esto falla, Python comprueba la ruta por defecto. En UNIX por ejemplo es /usr/local/lib/python.

La ruta de búsqueda de Python se encuentra en **sys.path**, esta ruta puede ampliarse en un proyecto para importar por defecto módulos.



## Gestión de Paquetes

Muchos módulos pueden empaquetarse en un conjunto de ficheros que aportan determinada utilidad. Estos módulos pueden gestionarse en nuestro proyecto a través de un **gestor de paquetes**.

[Pip](https://pypi.org/project/pip/) es el gestor de paquetes más popular de Python y permite instalar rápidamente módulos que necesitemos.

Los módulos publicados en pip se pueden encontrar en [PyPI](https://pypi.org/), donde se puede encontrar información relativa a un paquete como el historial, referencia al código, licencias...

Para instalar un paquete, solo tenemos que ejecutar:

In [None]:
!pip install numpy

In [None]:
import numpy

print(numpy.__version__)

# I/O

**Print**

Dentro de las funciones de entrada y de salida hemos estado viendo particularmente una durante las últimas clases, la función **print**. Si no os lo habíais preguntado antes, *print* es una función del sistema que imprime por pantalla una cadena de caracteres. Supongo que ya lo domniaréis pero se declara de la siguiente forma:


In [None]:
print("Hello World")
test = "Other"
print(test)

Hello World
Other


**Input**

La función de entrada en python se escribe con la palabra reservada **input**. Seguro que os sonará de un ejercicio en el que pedíamos una entrada de caracteres, y como se supone, esta función recoge la entrada del usuario por linea de comandos y la devuelve en formato de cadena de caracteres.

In [None]:
name = input("Say your name:")

print(f"Hello, {name}, How are yo?")

Say your name:jose
Hello, jose, How are yo?


**Open**

La función open permite abrir determinados archivos, su sintaxis es la siguiente:



```
> f = open('workfile', [flag])
```

Siendo el primer argumento la ruta del archivo a abrir y la segunda el modo en el que se abre, que puede ser:



*   **r** -> Abre el fichero para solo lectura. El puntero se sitúa al principio del archivo. Es el modo por defecto.
*   **rb** -> Abre el fichero en modo solo lectura con formato binario. El puntero se sitúa al principio del archivo.
*   **r+** -> Abre el archivo en modo lectura y escritura. El puntero se sitúa al principio del archivo.
*   **rb+** -> Abre el archivo en modo lectura y escritura con formato binario. El puntero se sitúa al principio del archivo.
*   **w** -> Abre un archivo para solo escritura. Sobreescribe el fichero si existe. Si no existe, crea el archivo.
*   **wb** -> Abre un archivo para solo lectura en formato binario.  Sobreescribe el fichero si existe. Si no existe, crea el archivo.
*   **a** -> Abre el archivo para agregar texto. El puntero se sitúa al final del archivo si existe. Si no existe crea uno nuevo para escritura. 
*   **a+** -> Abre el archivo para agregar texto en formato binario. El puntero se sitúa al final del archivo si existe. Si no existe crea uno nuevo para escritura. 
*   **ab** -> Abre el archivo para agregar texto y lectura. El puntero se sitúa al final del archivo si existe. Si no existe crea uno nuevo para escritura. 
*   **ab+** ->  Abre el archivo para agregar texto y lectura en formato binario. El puntero se sitúa al final del archivo si existe. Si no existe crea uno nuevo para escritura. 







**File**

La función **open** nos devuelve un objeto de tipo **file**. Con este objeto podremos realizar las siguientes operaciones:



*   **file.closed** -> Nos devuelve si el archivo está cerrado.
*   **file.mode** -> Nos indica el tipo de acceso.
*   **file.name** -> Devuelve el nombre del archivo.
*   **file.close()** -> Función que cierra y el archivo y serializa los cambios.



**CSV**

Uno de los formatos más comúnes dentro del mundo de Data Science es organizar los datos en CSV delimitados, para ello hay que usar la función **open** y hacer un cast a **csvfile** y llamar al lector de csv, como en el siguiente ejemplo:



```
import csv

with open('data.csv') as csvfile:
        reader = csv.DictReader(csvfile, delimiter=';')
        for row in reader:
```



# Excepciones

Python provee un mecanismo muy potente de control de errores. Saber utilizar esta herramienta es muy importante ya que protege el código de errores inesperados y permite anteponerse y ejecutar diferentes lineas de código dependiendo de si nuestro programa rompe su ejecución de una manera determinada.

Los tipos de excepciones que podemos encontrar son enormes y están recogidos en la [documentación oficial de Python](https://docs.python.org/3.7/library/exceptions.html).

La sintaxis para el tratamiento de errores es la siguiente:



```
try:
    Aquí va el código que queremos controlar, siempre identado...
    .......
    .......
except Exception1 as e:
    Aquí tratar la excepción 1 que hemos renombrado a "e"
except Exception2:
    Puede ocurrir otro tipo de excepción
.........
.........
else:
    Este bloque se ejecuta si no ha habido errores.
    
```

Hay varios puntos a tratar sobre las excepciones:



*   Un solo bloque **try** puede tener múltiples excepciones. Esto es muy útil cuando estamos tratando un fragmento de código que puede lanzar distintas excepciones.
*   También puede haber un **except** genérico que recoja cualquier excepción.
*   Después de una clausula **except** se puede añadir un bloque **else** para ejcutar código.



In [None]:
dict_test = {"hello": "hello", "world": "world"}

try:
  test = dict_test["other"]
except KeyError as e:
  print(e)
  test = "Not found"
  
print(f"We reach this part of the program with {test}")

# Python Orientado a Objetos







Entramos en uno de los conceptos más importantes dentro de la programación, el paradigma de la orientación a objetos. Como su nombre indica centra el desarrollo en una estructura llamada objetos.

Los conceptos de Programación Orientada a Objetos se remontan a principios de los 60, concretamente el lenguaje [Simula 67](https://en.wikipedia.org/wiki/Simula) fue el primero en incorporarlo, aunque no fue hasta los años 90 que se empezó a popularizar.

Hasta ahora hemos estado viendo programación estructurada, que es aquella en que los datos y los procedimientos están separados y sin relación y animan a centrar el desarrollo en procedimientos y funciones. El problema puede ser que se acabe con mucho código repetido o también llamado código espagueti.

La **Programación Orientada a Objetos** se centra en el desarrollo de objetos. Un objeto contiene toda la información que permite definirlo e identificarlo frente  a otros objetos pertenecientes a otras clases o sus propias clases, ya que puede tener diferentes valores en los **atributos**. Además tiene mecanísmos de interacción llamados **métodos** que favorece el cambio de estado o las acciones de los objetos.

In [None]:
wheels = 4
engine = 110
max_acc = 140
acc_seg = 80

def seg_to_mph(km):
  if km > 140:
    print("this car cannot")
    return
  return km/80

print(seg_to_mph(130))
  

In [None]:
wheels = 2
engine = 90
max_acc = 100
acc_seg = 40

def seg_to_mph(km):
  if km > 140:
    print("this car cannot")
    return
  return km/80

print(seg_to_mph(130))

In [None]:
test = 10 # variable --> atributo

def test(): # funcion --> metodo
  print("hola")



Simplificando lo anterior, podemos decir que en la Orientación a Objetos estructuramos **variables** y **funciones** en unidades lógicas, lo que llamaremos objetos. Estas **variables** son lo que hemos llamado **atributos** y las **funciones** serán los **métodos**.

Un ejemplo de objeto sería un coche. Un coche tiene **atributos** importantes como el color, el modelo, el año y el tipo de gasolina. Además podemos interactuar con el objeto mediante sus **métodos** como arrancar, o acelerar.

![alt text](https://res.cloudinary.com/practicaldev/image/fetch/s--O6de3Ai---/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://thepracticaldev.s3.amazonaws.com/i/k83oolqy85mixbnqra2w.PNG)

Aunque sea sorprendente, ya hemos usado múltiples objetos en Python, por ejemplo las listas. Las listas tienen **métodos** como append(), clear() o copy() y se organizan en unidades lógicas con una función. 



In [None]:
test = [4, 5, 6, 8]
test.clear()
print(test)

La orientación a objetos está sustentada por cuatro pilares fundamentales:


*   **Encapsulación** --> Agrupación de varios métodos y atributos en un objeto.
*   **Abstracción** --> Capacidad de ocultar la complejidad de una implementación.
*   **Herencia** --> Mecanismo para eliminar información redundante pudiendo compartir características.
*   **Polimorfismo** --> Literalmente significa muchas formas, capacidad de que cambie el comportamiento de un objeto dependiendo del tipo de dato de entrada.

Sabiendo estos conceptos básicos podemos meternos de lleno en los diferentes elementos:

### Clases

Son "prototipos" definidos por el programador que sirven como modelo para los atributos y los métodos de un objeto. Se podría hacer una analogía con las recetas de un plato. Con las clases podemos definir qué valores tendrá el objeto y qué podrá hacer.

Para crear una clase solo necesitamos declarar la palabra reservada *class* y definir la clase interna:



```
class NewClass(object):
    # Documentation
    class_body
```

Así podremos ver un ejemplo de clase completo con un coche:


In [None]:
class Car(object):
  'Common class for a car object'
  total_cars = 0 #secuencial number
  
  # Declaration
  def __init__(self, model, color, id="2342FSD"):
    self.model = model
    self.color = color
    self.id = id
    Car.total_cars += 1
    
  def get_model(self):
    return self.model
  
  def print_model(self):
    print(f"The car is {self.model}")
    
  def print_total_cars(self):
    print(f"Total amount of cars: {Car.total_cars}")
    
  def print_color(self):
    print(f"The color of the car is {self.color}")
    
  def start(self):
    print("Engine running")


Aquí podemos ver tres elementos importantes:



*   La variable *total_cars* es una variable compartida por todas las instancias de la clase, puede acceder estáticamente a través de una instancia *ClassName.variable*, en este caso *Car.serial_number*
*   El primer método *\_\_init__()* es un método especial reservado a la inicialización del objeto, llamado **constructor**. Este es llamado cuando se instancia un objeto.
*    Se declaran los atributos y los métodos, que son proipos de cada instancia. Para ello se usa la palabra reservada *self* tanto como primer argumento de un método como para referenciar a un atributo.



### Objetos

Un objeto es una instancia de una estructura de datos definida en una clase. Un objeto se compone tanto de **atributos** de clase como de métodos.

Para crear una instancia de una clase, solo hay que asignar a una variable la llamada al constructor de una clase y pasar los argumentos que acepta el constructor *\_\_init__*

En Python la instanciación de un objeto sería de la siguiente forma:



```
inst_object = NewClass(attribute)
```



In [None]:
# Objetc instantiation

opel_car = Car("opel", "red", "67458IUK")

mercedes_car = Car("mercedes", "blue", "2342IOS")

tesla_car = Car("tesla", "grey", "1234ABC")

#fail_car = Car()

### Atributos

Una vez instanciado el objeto, podremos acceder a sus atributos y métodos, para ello usaremos la notación de python (que ya conocemos bastante bien) con la llamada a la variable, seguida de un punto y el nombre del atribtuo o método.



```
isnt_object.attribute
inst_object.method()
```

Así vemos como acceder a los atributos de nuestros objetos ya instanciados:


In [None]:
# method call
opel_car.print_model()

# attribute_call
print(mercedes_car.color)

print(tesla_car.id)

En las llamadas a métodos, pese a que tenga como primer argumento *self* no es necesario declararlo, ya que como comentamos es una palabra reservada de Python para declarar una función como un método de clase.

Por otro lado, podremos modificar atributos de clase normalmente:

In [None]:
opel_car.color = "green"
opel_car.print_color()


Hay una serie de funciones de Python que permiten consultar ciertas características de los atributos en Python:



*   **getattr(obj, name)** -> Accede al atributo del objeto
*   **hasattr(obj, name)** -> Comprueba si el atributo existe
*   **setattr(obj, name)** -> Añade un atributo dinámicamente a un objeto
*   **delattr(obj, name)** -> Elimina dinámicamente un atributo



In [None]:
print(hasattr(opel_car, 'color'))    # returns true if color exists
print(getattr(opel_car, 'color'))    # returns value of 'color' attribute
setattr(opel_car, 'color', 'pruple') # Set attribute 'age' at 8
opel_car.print_color()
delattr(opel_car, 'color')    # deletes attribute 'color'
print(hasattr(opel_car, 'color'))

Por

In [None]:
print(f"Car.__doc__: {Car.__doc__}")
print(f"Car.__name__: {Car.__name__}")
print(f"Car.__module__: {Car.__module__}")
print(f"Car.__bases__: {Car.__bases__}")
print(f"Car.__dict__: {Car.__dict__}")


### Herencia

Para evitar la repetición de código de clases que puedan ser similares o compartan características en común, podemos derivar una clase de otra, haciendo que compartan tanto *atributos* como *métodos*.

La clase hija "hereda" toda esto y lo puede utilizar según su conveniencia, adaptando valores para el propósito de la clase.

La sintaxis de la herencia en Python es la siguiente:



```
class ParentClass(object):
    object definition
    def __init__(self):
        constructor...
    
class ChildClass(ParentClass):
     objedct definition
     def __init__(self):
        super().__init__() #optional
```

Esto lo podemos ver con un ejemplo claro:


In [None]:
class Vehicle(object):
  
  def __init__(self):
    self.number_wheels = 0
    self.model = ""
    self.color = ""
  
  def print_model(self):
    print(f"Model of the vehicle is: {self.model}")
  
  def print_number_wheels(self):
    print(f"Number of wheels: {self.number_wheels}")
  
  def print_color(self):
    print(f"Color: {self.color}")

class Bike(Vehicle):
  
  def __init__(self, model, color):
    self.number_wheels = 2
    self.model = model
    self.color = color
    
class Car(Vehicle):
  
  def __init__(self, model, color):
    self.number_wheels = 4
    self.model = model
    self.color = color

In [None]:
bike = Bike("Yamaha", "black")
bike.print_model()
bike.print_number_wheels()
bike.print_color()

car = Car("Opel", "red")
car.print_model()
car.print_number_wheels()
car.print_color()

### Polimorfismo

Polimorfismo es la capacidad de un método de una clase o una función de comportarse de forma diferente dependiendo de los parámetros de entrada. Esto lo hemos visto en algunas funciones como *len()*

In [None]:
list_1 = [1, 2 ,3]
str_1 = "Hello"
print(len(list_1))
print(len(str_1))

# Python en Machine Learning

Como hemos ido discutiendo a lo largo de los talleres, Python es un lenguaje muy popular dentro del ML, muchas de las razones son su facilidad de uso, herramientas como Jupyter Notebooks, la gran cantidad de librerías orientadas al *Data Science* y la comunidad que hay detrás de este lenguaje de programación.

No es de extrañar que algunas de las librerías y frameworks más populares dentro de ML estén escritas en este lenguaje (o tengan una interfaz en Python).

Así vamos a hablar de las principales librerías de tratamiento de datos y de los frameworks/librerías más famosas de ML en Python

## Introducción a Numpy, Pandas, Sckit-learn



*   [Numpy](https://www.numpy.org/) -> Librería destinada a la manipulación de matrices, especialmente dentro de operaciones matemáticas.
*   [SciPy](https://www.scipy.org/) -> Otra librería de Python orientada a computación técnica y científica.
*   [Matplotlib](https://matplotlib.org/) -> Muy útil para visualización de datos.
*   [Pandas](https://pandas.pydata.org/) -> Especializada en manipulación de datos y posterior análisis.
*   [Scikit-Learn](https://scikit-learn.org/stable/) -> Paquete de Python diseñado para dar acceso a algoritmos de Aprendizaje Automático bien conocidos dentro del código Python, a través de una API limpia y bien pensada. Ha sido construido por cientos de colaboradores de todo el mundo y se usa en la industria y el mundo académico.
Scikit-Learn esá basada en las librerías **NumPy** (Numerical Python) y **SciPy** (Scientific Python), que permiten la computación numérica y científica eficiente en Python.




Google tiene dos ejemplos rápidos para introducción a Numpy y Pandas:



*   [Ejercicio Numpy](https://colab.research.google.com/github/google/eng-edu/blob/master/ml/cc/exercises/numpy_ultraquick_tutorial.ipynb?utm_source=mlcc&utm_campaign=colab-external&utm_medium=referral&utm_content=numpy_tf2-colab&hl=en)
*   [Ejercicio Pandas](https://colab.research.google.com/github/google/eng-edu/blob/master/ml/cc/exercises/pandas_dataframe_ultraquick_tutorial.ipynb?utm_source=mlcc&utm_campaign=colab-external&utm_medium=referral&utm_content=pandas_tf2-colab&hl=en)



## Introducción a Tensorflow

Tensorflow es un framework computacional creado para construir modelos de *Machine Learning*. Tensorflow proporciona una variedad de herramientas que permiten construir modelos a distintos niveles de abstracción.

Así un programador puede usar las *APIs* de bajo nivel para construir modelos basados en una serie de operaciones matemáticas como usar las *APIs* de alto nivel para especificar arquitecturas predefinidas como regresiones lineales o redes neuronales.

Esta foto, sacada de Google, nos muestra la arquitectura de Tensorflow:


---



![Tensorflow arch](https://developers.google.com/machine-learning/crash-course/images/TFHierarchyNew.svg)



---

Así pdoemos definir las siguientes capas:



*   **Keras (tf.keras)** --> OOP API de alto nivel.
*   **Estimator (tf.estimator)** --> OOP API de alto nivel.
*   **tf.layers/tf.losses/tf.metrics** --> Bibliotecas de modelos comunes.
*   **Python Tensorflow** --> Wrap de Tensorflow en Python.
*  **C++ TensorFlow** --> Aplicación de TensorFlow escrita en C++ (POO), abstrae el hardware
*   **CPU/GPU/TPU** --> Hardware usado por TensorFlow, parte de su potencia es que puede ejecutarse en muchas arquitecturas.



Tensorflow consiste de dos componentes:



*   [Un buffer de grafos](https://www.tensorflow.org/guide/extend/model_files#protocol_buffers), la unidad elemental en Tensorflow.
*   Un archivo en ejecución que ejecuta, de forma distribuida, el grafo.


Sería análogo a hablar entre el código en Python y el intérprete en Python. Así como el interprete en Python se implementa en muchas plataformas de hardware, TensorFlow puede ejecutar el grafo en múltiples arquitecturas, incluyendo CPU, GPU y TPU.



**Hello World en Tensorflow**

En Tensorflow, se declara el helloworld importando la librería *tensorflow*. Las constantes analizadas para ejecutar en una sesión de tensorflow se declaran con tf.constant y se ejecuta una interfaz sessión con *tf.Session()*

**A partir de Tensorflow 2.0 los programas se ejecutan en "modo impaciente" por lo que no se necesitan sesiones para crear constantes**

In [None]:
# Hello World In Tensorflow 1
import tensorflow as tf

with  tf.compat.v1.Session() as sess:
  hello = tf.constant("Hello")
  world = tf.constant(" World!")
  hello_world = hello + world
  res = sess.run(hello_world)
  print(res)
  print(hello_world)

In [1]:
# Hello World in Tensorflow 2
import tensorflow as tf

print(tf.__version__)

hello = tf.constant('Hello')
world = tf.constant('World!')
hello_world = hello + world


#print the message
print(hello_world)


2.4.0
tf.Tensor(b'HelloWorld!', shape=(), dtype=string)


In [2]:
print(hello_world)

tf.Tensor(b'HelloWorld!', shape=(), dtype=string)


Esta variable conforma el protocolo del modelo de grafo computacional (computation graph model) de Tensorflow, que primero define que computos deben hacerse para luego ejecutarlos en un mecanismo externo.

**MNIST**

El dataset de dígitos de MNIST (Mixed National Institute of Standards and Technology) es uno de los datasets más usados dentro de la investigación y la Visión Artificial, y ha tenido un rol muy importante dentro del desarrollo de Redes Neuronales pretenecientes al *depp learning*.

Algunas de las figuras que continen el dataset serían las siguientes.

![MNist](https://upload.wikimedia.org/wikipedia/commons/2/27/MnistExamples.png)

El el siguiente cuadro de código veremos un clasificador muy simple llamado [softmax regression](http://deeplearning.stanford.edu/tutorial/supervised/SoftmaxRegression/). No entraremos en profundidad en la parte matemática ya que nos interesa más bien la estructura de TensorFlow.

Su funcionamiento consiste en que el modelo intentará de resolver, por cada pixel, que digitos tienen valores altos y bajos en cada espacio. Es decir, en los píxeles centrales es muy probable que sean negros para los 0 mientras que sean blancos para los 1.

El objetivo de este modelo consiste en encontrar pesos que nos asegure la evidencia de la existencia de cada uno de los dígitos, sin usar la información espacial del pixel.

Es por ello que para el siguiente ejemplo usaremos Keras para:


1.   Construir una red neuronal que clasifique imágenes.
2.   Entrenar esa red neuronal.
3.   Evaluar la precisión del modelo



Lo primero sería importar tensorflow y preparar el dataset de MNIST. Convirtiendo los ejemplos de enteros a numeros con coma flotante:

In [None]:
import tensorflow as tf
mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

Ahora constuiremos el modelo ```tf.keras.Sequiential```añadiendo las capas. Elegiremos un optimizador y una función de perdida.

In [None]:
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])

Por cada ejemplo, el modelo devuelve un vetor de "[logits](https://developers.google.com/machine-learning/glossary#logits)" o "[log-odds](https://developers.google.com/machine-learning/glossary#log-odds)", uno para cada clase, que son vectores de predicción del modelo.

In [None]:
predictions = model(x_train[:1]).numpy()
predictions

La función ```tf.nn.softmax``` convierte estos logits en probabilidades para cada clase.

In [None]:
tf.nn.softmax(predictions).numpy()

La función de perdida `losses.SparseCategoricalCrossentropy` coge un vector de logits y un Inidce `True`y devuelve una perdida escalar por cada ejemplo.

In [None]:
loss_fn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)

Esta perdida es igual a la probabilidad logarítmica negativa de la clase: Es cero si el modelo está seguro de la clase correcta.

El modelo si entrenar da probabilidades cercanas a algo aleatorio (1/10 por cada clase), así que la perdida inicial suele estar cerca de: `-tf.log(1/10) ~= 2.3`.

In [None]:
loss_fn(y_train[:1], predictions).numpy()

In [None]:
model.compile(optimizer='adam',
              loss=loss_fn,
              metrics=['accuracy'])

El método `Model.fit`ajusta los parámetros del modelo para minimizar la perdida:

In [None]:
model.fit(x_train, y_train, epochs=5)

El método `Model.evaluate` comprueba el desempeño del modelo.

In [None]:
model.evaluate(x_test,  y_test, verbose=2)

Ahora el modelo está entrenado para tener una probabilidad del 97%

# Modelo para convertir temperatura

<table class="tfo-notebook-buttons" align="left">
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/tensorflow/examples/blob/master/courses/udacity_intro_to_tensorflow_for_deep_learning/l02c01_celsius_to_fahrenheit.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />Run in Google Colab</a>
  </td>
  <td>
    <a target="_blank" href="https://github.com/tensorflow/examples/blob/master/courses/udacity_intro_to_tensorflow_for_deep_learning/l02c01_celsius_to_fahrenheit.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png" />View source on GitHub</a>
  </td>
</table>

## Comentario del profesor

Este Colab es un modelo creado por Google para resolver el algorítmo que vimos de conversión de grados centígrados a farenheit.

Aquí podemos ver ya la diferencia entre un algorítmo y un modelo a la hora de resolver una tarea determinada.

Este no es el mejor ejemplo posible, ya que el algorítmo que queremos usar es bastante sencillo, pero imaginad que el algorítmo fuese una clasificación de imágenes... ¿Cómo lo afrontaríais si fuera por código?.

Primero, vamos a ver como convertir en Python de centígrados a kelvin.

In [None]:
def temp_conversion(temp):
  return list(map(lambda val: (val * 9/5) + 32, temp))

temperatures = [-40, -10,  0,  8, 15, 22,  38]
print(temp_conversion(temperatures))

Ahora exploraremos como generar un modelo de ML que realice la misma función que este algoritmo.


## ML Model

Welcome to this Colab where you will train your first Machine Learning model!

We'll try to keep things simple here, and only introduce basic concepts. Later Colabs will cover more advanced problems.

The problem we will solve is to convert from Celsius to Fahrenheit, where the approximate formula is:

$$ f = c \times 1.8 + 32 $$


Of course, it would be simple enough to create a conventional Python function that directly performs this calculation, but that wouldn't be machine learning.


Instead, we will give TensorFlow some sample Celsius values (0, 8, 15, 22, 38) and their corresponding Fahrenheit values (32, 46, 59, 72, 100).
Then, we will train a model that figures out the above formula through the training process.

## Import dependencies

First, import TensorFlow. Here, we're calling it `tf` for ease of use. We also tell it to only display errors.

Next, import [NumPy](http://www.numpy.org/) as `np`. Numpy helps us to represent our data as highly performant lists.

In [None]:
import tensorflow as tf

In [None]:
import numpy as np
import logging
logger = tf.get_logger()
logger.setLevel(logging.ERROR)

## Set up training data

As we saw before, supervised Machine Learning is all about figuring out an algorithm given a set of inputs and outputs. Since the task in this Codelab is to create a model that can give the temperature in Fahrenheit when given the degrees in Celsius, we create two lists `celsius_q` and `fahrenheit_a` that we can use to train our model.

In [None]:
celsius_q    = np.array([-40, -10,  0,  8, 15, 22,  38],  dtype=float)
fahrenheit_a = np.array([-40,  14, 32, 46, 59, 72, 100],  dtype=float)

for i,c in enumerate(celsius_q):
  print("{} degrees Celsius = {} degrees Fahrenheit".format(c, fahrenheit_a[i]))

### Some Machine Learning terminology

 - **Feature** — The input(s) to our model. In this case, a single value — the degrees in Celsius.

 - **Labels** — The output our model predicts. In this case, a single value — the degrees in Fahrenheit.

 - **Example** — A pair of inputs/outputs used during training. In our case a pair of values from `celsius_q` and `fahrenheit_a` at a specific index, such as `(22,72)`.


## Create the model

Next, create the model. We will use the simplest possible model we can, a Dense network. Since the problem is straightforward, this network will require only a single layer, with a single neuron.

### Build a layer

We'll call the layer `l0` and create it by instantiating `tf.keras.layers.Dense` with the following configuration:

*   `input_shape=[1]` — This specifies that the input to this layer is a single value. That is, the shape is a one-dimensional array with one member. Since this is the first (and only) layer, that input shape is the input shape of the entire model. The single value is a floating point number, representing degrees Celsius.

*   `units=1` — This specifies the number of neurons in the layer. The number of neurons defines how many internal variables the layer has to try to learn how to solve the problem (more later). Since this is the final layer, it is also the size of the model's output — a single float value representing degrees Fahrenheit. (In a multi-layered network, the size and shape of the layer would need to match the `input_shape` of the next layer.)


In [None]:
l0 = tf.keras.layers.Dense(units=1, input_shape=[1])

### Assemble layers into the model

Once layers are defined, they need to be assembled into a model. The Sequential model definition takes a list of layers as an argument, specifying the calculation order from the input to the output.

This model has just a single layer, l0.

In [None]:
model = tf.keras.Sequential([l0])

**Note**

You will often see the layers defined inside the model definition, rather than beforehand:

```python
model = tf.keras.Sequential([
  tf.keras.layers.Dense(units=1, input_shape=[1])
])
```

## Compile the model, with loss and optimizer functions

Before training, the model has to be compiled. When compiled for training, the model is given:

- **Loss function** — A way of measuring how far off predictions are from the desired outcome. (The measured difference is called the "loss".)

- **Optimizer function** — A way of adjusting internal values in order to reduce the loss.


In [None]:
model.compile(loss='mean_squared_error',
              optimizer=tf.keras.optimizers.Adam(0.1))

These are used during training (`model.fit()`, below) to first calculate the loss at each point, and then improve it. In fact, the act of calculating the current loss of a model and then improving it is precisely what training is.

During training, the optimizer function is used to calculate adjustments to the model's internal variables. The goal is to adjust the internal variables until the model (which is really a math function) mirrors the actual equation for converting Celsius to Fahrenheit.

TensorFlow uses numerical analysis to perform this tuning, and all this complexity is hidden from you so we will not go into the details here. What is useful to know about these parameters are:

The loss function ([mean squared error](https://en.wikipedia.org/wiki/Mean_squared_error)) and the optimizer ([Adam](https://machinelearningmastery.com/adam-optimization-algorithm-for-deep-learning/)) used here are standard for simple models like this one, but many others are available. It is not important to know how these specific functions work at this point.

One part of the Optimizer you may need to think about when building your own models is the learning rate (`0.1` in the code above). This is the step size taken when adjusting values in the model. If the value is too small, it will take too many iterations to train the model. Too large, and accuracy goes down. Finding a good value often involves some trial and error, but the range is usually within 0.001 (default), and 0.1

## Train the model

Train the model by calling the `fit` method.

During training, the model takes in Celsius values, performs a calculation using the current internal variables (called "weights") and outputs values which are meant to be the Fahrenheit equivalent. Since the weights are initially set randomly, the output will not be close to the correct value. The difference between the actual output and the desired output is calculated using the loss function, and the optimizer function directs how the weights should be adjusted.

This cycle of calculate, compare, adjust is controlled by the `fit` method. The first argument is the inputs, the second argument is the desired outputs. The `epochs` argument specifies how many times this cycle should be run, and the `verbose` argument controls how much output the method produces.

In [None]:
history = model.fit(celsius_q, fahrenheit_a, epochs=500, verbose=True)
print("Finished training the model")

In later videos, we will go into more detail on what actually happens here and how a Dense layer actually works internally.

## Display training statistics

The `fit` method returns a history object. We can use this object to plot how the loss of our model goes down after each training epoch. A high loss means that the Fahrenheit degrees the model predicts is far from the corresponding value in `fahrenheit_a`.

We'll use [Matplotlib](https://matplotlib.org/) to visualize this (you could use another tool). As you can see, our model improves very quickly at first, and then has a steady, slow improvement until it is very near "perfect" towards the end.


In [None]:
import matplotlib.pyplot as plt
plt.xlabel('Epoch Number')
plt.ylabel("Loss Magnitude")
plt.plot(history.history['loss'])

## Use the model to predict values

Now you have a model that has been trained to learn the relationship between `celsius_q` and `fahrenheit_a`. You can use the predict method to have it calculate the Fahrenheit degrees for a previously unknown Celsius degrees.

So, for example, if the Celsius value is 100, what do you think the Fahrenheit result will be? Take a guess before you run this code.

In [None]:
print(model.predict([100.0]))

The correct answer is $100 \times 1.8 + 32 = 212$, so our model is doing really well.

### To review


*   We created a model with a Dense layer
*   We trained it with 3500 examples (7 pairs, over 500 epochs).

Our model tuned the variables (weights) in the Dense layer until it was able to return the correct Fahrenheit value for any Celsius value. (Remember, 100 Celsius was not part of our training data.)


## Looking at the layer weights

Finally, let's print the internal variables of the Dense layer. 

In [None]:
print("These are the layer variables: {}".format(l0.get_weights()))

The first variable is close to ~1.8 and the second to ~32. These values (1.8 and 32) are the actual variables in the real conversion formula.

This is really close to the values in the conversion formula. We'll explain this in an upcoming video where we show how a Dense layer works, but for a single neuron with a single input and a single output, the internal math looks the same as [the equation for a line](https://en.wikipedia.org/wiki/Linear_equation#Slope%E2%80%93intercept_form), $y = mx + b$, which has the same form as the conversion equation, $f = 1.8c + 32$.

Since the form is the same, the variables should converge on the standard values of 1.8 and 32, which is exactly what happened.

With additional neurons, additional inputs, and additional outputs, the formula becomes much more complex, but the idea is the same.

### A little experiment

Just for fun, what if we created more Dense layers with different units, which therefore also has more variables?

In [None]:
l0 = tf.keras.layers.Dense(units=4, input_shape=[1])
l1 = tf.keras.layers.Dense(units=4)
l2 = tf.keras.layers.Dense(units=1)
model = tf.keras.Sequential([l0, l1, l2])
model.compile(loss='mean_squared_error', optimizer=tf.keras.optimizers.Adam(0.1))
model.fit(celsius_q, fahrenheit_a, epochs=500, verbose=False)
print("Finished training the model")
print(model.predict([100.0]))
print("Model predicts that 100 degrees Celsius is: {} degrees Fahrenheit".format(model.predict([100.0])))
print("These are the l0 variables: {}".format(l0.get_weights()))
print("These are the l1 variables: {}".format(l1.get_weights()))
print("These are the l2 variables: {}".format(l2.get_weights()))

As you can see, this model is also able to predict the corresponding Fahrenheit value really well. But when you look at the variables (weights) in the `l0` and `l1` layers, they are nothing even close to ~1.8 and ~32. The added complexity hides the "simple" form of the conversion equation.

Stay tuned for the upcoming video on how Dense layers work for the explanation.

# Más ejemplos con Keras

Keras es una parte integral de Tensorflow 2.0. Esta librería/framework permite crear modelos de Machine Learning en pocas lineas y de una forma muy *Pythonica*.

En la propia página de Tensorflow podemos encontrar algunos ejemplos como:



*   [Clasificación de Imágenes](https://www.tensorflow.org/tutorials/keras/classification)
*   [Clasificación de Texto](https://www.tensorflow.org/tutorials/keras/text_classification)
*   [Regresión](https://www.tensorflow.org/tutorials/keras/regression)
*   [Overfit y Underfit](https://www.tensorflow.org/tutorials/keras/overfit_and_underfit)



# Bonus: R

R es un lenguaje de alto nivel como Python, muy orientado al análisis de datos y la estadística, por lo que es  una opción muy interesante para Machine Learning.

R nació en 1995 como un lenguaje *open source* que contenía una gran cantidad de métodos de cálculos gráficos y estadísticos. Muchas empresas como Uber, Airbnb o Facebook lo usan.

No soy un gran experto en la materia, ya que no lo he usado profesionalmente, pero a lo largo de diversas investigaciones me he visto en la necesidad de manejar proyectos en R.

Algunos de los puntos fuertes de R es que no es necesario instalar dependencias externas para hacer operaciones complejas. Es un lenguaje muy optimizado para cálculos computacionales intensos y cuenta con algunos IDEs muy potentes para su uso como [RStudio](https://www.rstudio.com/products/rstudio/).


**Python vs. R**

Si os estáis preguntando qué lenguaje de programación usar, la respuesta siempre es que depende del objetivo del proyecto. Incluso hay ocasiones en las que un mismo proyecto necesita de diversos lenguajes de programación para cumplir su objetivo.

Dejo aquí varios recursos que exploran las bondades y deficiencias de este lenguaje de programación y lo comparan con Python en materia de Machine Learning:



*   [Python vs R. Choosing the Best Tool for AI, ML & Data Science](https://medium.com/datadriveninvestor/python-vs-r-choosing-the-best-tool-for-ai-ml-data-science-7e0c2295e243)
*   [Python vs. R: Which Should You Choose For Your Next ML Project?](https://dzone.com/articles/python-or-r-which-should-you-choose-for-your-next)
*   [From ‘R vs Python’ to ‘R and Python’](https://towardsdatascience.com/from-r-vs-python-to-r-and-python-aa25db33ce17)
