# Repaso de Python

- Objetivo:
    - Repasar características del lenguaje.
    - Foco en las de mayor relevancia para ML, Numpy/Pandas, etc.
    - Algunos conceptos de:
        - Ingeniería de SW
        - Algoritmos y estructuras de datos.

# Repaso de Python

- Plan (1/2):
    1. Variables y estructuras de datos
        - Tipos y asignación.
        - Colecciones: listas, tuplas, conjuntos y diccionarios
    2. Funciones
        - Funciones Lambda
    3. Ramificación
    4. Iteración

# Repaso de Python

- Plan (2/2):    
    5. Programación orientada a objetos
    6. Complejidad
    7. Manejo de errores y debugging
    8. Organización del código en módulos

# 1. Variables y estructuras de datos

Cuando iniciamos una sesión, no hay ninguna variable creada.

In [1]:
# En IPython, podemos ver las variables con %who
%whos

Interactive namespace is empty.


La creación de una variable es la asociación de la instancia de un nuevo objeto en memoria a un nombre. 

In [2]:
a = 3
b = 0.72 
c = False 
d = "Hola" 
e = object()

In [3]:
%whos

Variable   Type      Data/Info
------------------------------
a          int       3
b          float     0.72
c          bool      False
d          str       Hola
e          object    <object object at 0x7fcd68dbbca0>


Podemos ver el tipo de una variable con **type()** y su dirección o handle con **id()**.

In [4]:
type(a),type(b),type(c),type(d)

(int, float, bool, str)

In [5]:
id(a),id(b),id(c),id(d)

(94535593185984, 140520195417392, 94535593062944, 140520194539056)

En python la asignación establece un vínculo entre el nombre de la variable y un nuevo objeto creado. 

Por ejemplo, si asignamos el número 2 a una variable y luego asignamos el 3, cada asignación instancia un nuevo objeto (esto es distinto que en otros lenguajes, como por ejemplo C, que distinguen entre tipos primitivos y objetos).

In [6]:
a = 2
print(type(a)) # Tipo 'int'
print(id(a)) # Un valor.
a = 3
print(id(a)) # Un valor distinto del anterior

<class 'int'>
94535593185952
94535593185984


## 1.1 Contenedores: listas, tuplas, conjuntos y diccionarios

In [7]:
# Limpiamos el contexto
%reset

Once deleted, variables cannot be recovered. Proceed (y/[n])? y


####  Listas

- Colección de elementos ordenados.
- Se instancian con

~~~python
a_list = []
a_list = list()
~~~

In [8]:
a_list = [ 1,2,3,4,5,6 ]
type(a_list)

list

In [None]:
a_list

Slicing e indexado.

In [9]:
print(a_list)

a_list[0],a_list[-1],a_list[2:4],a_list[3:],a_list[:2]

[1, 2, 3, 4, 5, 6]


(1, 6, [3, 4], [4, 5, 6], [1, 2])

In [12]:
a_list[::-2] # Recorrer de a 1 

[6, 4, 2]

In [None]:
# Notación para rangos: [inicio]:[fin]:[paso]. 
# Valores por defecto: inicio=0,fin=-1,paso=1
a_list[::2] # Recorrer de a 2 

In [None]:
a_list[::-1] # Recorrer en orden inverso

In [None]:
# Ídem, usando operador de rango
a_list = list(range(1,7,1)) # Creación por rango
a_list

Agregar, insertar, remover.

In [None]:
a_list.append(7)
a_list

In [None]:
a_list.insert(0,0.5)
a_list

In [None]:
a_list.remove(4)
a_list

In [13]:
len(a_list)

6

####  Tuplas

- Similares a las listas, pero inmutables.

In [14]:
a_tuple = (1,2,3,4,5,6)
type(a_tuple)

tuple

In [None]:
a_tuple

In [15]:
try:
    a_tuple[0] = 99 # Falla
except TypeError: 
    print("No asignable")
    pass
a_tuple

No asignable


(1, 2, 3, 4, 5, 6)

####  Conjuntos (sets)

- Pueden almacenar una colección no ordeanada de elementos no duplicados.
- Soportan operaciones como Union, Intersección, Diferencia, etc.

In [16]:
a_set = {1,2,3,4,5,6}
type(a_set)

set

In [17]:
2 in a_set

True

In [18]:
99 in a_set

False

In [19]:
# Unión
{1,2,4,7} | { 3, 5, 6 } 

{1, 2, 3, 4, 5, 6, 7}

In [20]:
# Intersección
{1,2,3,4,5,6,7} & { 3, 5, 6 } 

{3, 5, 6}

In [21]:
# Diferencia
{1,2,3,3,4,5,6} - {2,5}

{1, 3, 4, 6}

In [None]:
# Diferencia simétrica 
# (subconjunto de elementos que están en ambos conjuntos, pero no en su intersección)
{1,2,3,3,4,5,6}.symmetric_difference({2,3,4})

In [22]:
# Testeo de inclusión: A contenido en B?
a = { 1,2,3,4,5,6 }
b = { 1,4 }
c = { 1,4,7}
b.issubset(a),c.issubset(a)

(True, False)

*Tip*: se puede usar un conjunto para obtener los elementos únicos de una lista.

In [23]:
all_values = [ 1,1,3,4,5,1,2,3,5,4,2,1,2,3,4,5,6,2,3,4,5,10,41, ]
set(all_values)

{1, 2, 3, 4, 5, 6, 10, 41}

#### Diccionarios

Pueden verse como tablas o mapas que asocian un elemento a otro de forma eficiente.


In [25]:
a_dict = { 
    "my_int": 42,
    "my_list": [1,"dog", False, 0.376],
    "my_tuple": (2,"cat", True, 1.376),
    "my_set": {"poker", "truco", 10},
    "my_dict": { "some_key": False },
    "my_square": lambda x: x**2
}
a_dict

{'my_int': 42,
 'my_list': [1, 'dog', False, 0.376],
 'my_tuple': (2, 'cat', True, 1.376),
 'my_set': {10, 'poker', 'truco'},
 'my_dict': {'some_key': False},
 'my_square': <function __main__.<lambda>(x)>}

In [26]:
a_dict.keys()

dict_keys(['my_int', 'my_list', 'my_tuple', 'my_set', 'my_dict', 'my_square'])

In [27]:
a_dict.items()

dict_items([('my_int', 42), ('my_list', [1, 'dog', False, 0.376]), ('my_tuple', (2, 'cat', True, 1.376)), ('my_set', {'poker', 'truco', 10}), ('my_dict', {'some_key': False}), ('my_square', <function <lambda> at 0x7fcd64177cb0>)])

In [28]:
a_dict = dict([("a",10),("b",20),("c",30)])
a_dict

{'a': 10, 'b': 20, 'c': 30}

In [29]:
"a" in a_dict, "z" in a_dict

(True, False)

## 2. Funciones

Funciones incluidas en el lenguaje (built-in).

In [30]:
# built-in
type(len),type(id),isinstance(4,int)

(builtin_function_or_method, builtin_function_or_method, True)

Funciones definidas

In [31]:
def my_square(x):
    return x**2

print(my_square(2))
print(type(my_square))

4
<class 'function'>


Funciones anidadas.

In [32]:
def make_multiplier(coeff):
    def wrapper(x):
        return coeff2 * x
    return wrapper

duplicator = make_multiplier(2)
triplicator = make_multiplier(3)

type(duplicator),type(triplicator)

(function, function)

In [33]:
duplicator(2), triplicator(2)

(4, 6)

### 2.1 Funciones Lambda

In [34]:
another_duplicator = lambda x: x*2
type(another_duplicator)

function

In [None]:
another_duplicator(2)

# 3. Ramificación

In [35]:
expression = True
if expression:
    print("True")
else:
    print("False")    

True


A diferencia de otros lenguajes, Python no tiene un equivalente de switch/select case. 

Una forma de obtener una funcionalidad similar es con cadenas if-elif-elif-....else.

In [None]:
expression = None
if expression == 1:
    print("Option 1")
elif expression ==  2:
    print("Option 2")
# ...    
else:
    print("Default Option")

Otra forma es con tablas (diccionarios) de acciones.

In [None]:
def action1():
    print("Option 1")
    
def action2():
    print("Option 2")
    
def default_action():
    print("Default Option")
        
action_map = {
    1: action1,
    2: action2,
    'default': default_action
}

option=1
action_map[option]() if option in action_map else action_map['default']()

# 4. Iteración

> Iteración significa repetir varias veces un proceso con la intención de alcanzar una meta deseada, 
> objetivo o resultado. Cada repetición del proceso también se le denomina una "iteración", y los 
> resultados de una iteración se utilizan como punto de partida para la siguiente iteración.

Fuente: Wikipedia.

Es habitual iterar sobre una colección de elementos para realizar alguna acción (por ejemplo, todos los elementos de un vector o matriz, las entradas de una tabla, los elementos de un conjunto).

In [36]:
some_iterable_collection_1 = { 1,2,3,4 } # Puede ser una lista, tupla, diccionario, set, etc.
for i in some_iterable_collection_1: 
    print(i)

1
2
3
4


A menudo es útil para cada iteración conocer el índice o posición de un elemento. **enumerate()** devuelve el índice de iteración seguido del elemento.

In [37]:
for i,v in enumerate(["cero","uno","dos","último"]):
    print(i,v)

0 cero
1 uno
2 dos
3 último


## 4.1 List comprehension y  dictionary comprehension

Es menudo es útil construir listas a partir de iteraciones en colecciones.

In [38]:
[ (i**2) for i in some_iterable_collection_1]

[1, 4, 9, 16]

In [39]:
some_iterable_collection_2 = {"a": 1, "b": 2, "c": 3}
{ k:v**2 for k,v in some_iterable_collection_2.items()}

{'a': 1, 'b': 4, 'c': 9}

## 4.2 while()

A veces la condición de término de un proceso no es haber consumido el último elemento de un conjunto, sino haber alcanzado una condición.

In [43]:
import random

# Genera una secuencia de números aleatorios hasta que alguno supere threeshold
# o se llegue a un máximo de iteraciones
def generate_seq(threeshold=0.5,max_n=10):
    result = []
    keep_running = True
    i = 0
    while keep_running:        
        x = random.random()                 
        if (x <= threeshold):
            result.append(x) 
        keep_running = (i < max_n) & (x <= threeshold)
        i+=1
    return result

generate_seq(0.6,5)

[0.48477431362234635, 0.012618063224854703, 0.48173997521742384]

## 4.3 Generators

Existe una forma más elegante de representar el problema anterior.

> Un **generador** es una rutina especial que se puede usar para controlar el comportamiento de un iterador en un bucle. Un generador es muy similar a una función que devuelve un vector, en el que un generador tiene los parámetros que se pueden llamar, y genera una secuencia de valores.
> En lugar de construir un vector que contenga todos los valores y devolverlos de una vez, un generador proporciona un valor a la vez, lo que requiere menos memoria y, por lo tanto, permite que quien lo llama comience a procesar los primeros valores inmediatamente. En resumen, un generador se asemeja a una función pero se comporta como un iterador.

Fuente: Wikpedia.

In [44]:
# Genera una secuencia de números aleatorios 
# hasta que alguno supere threeshold o se alcance un máximo de iteraciones
def seq_generator(threeshold=0.5,max_n=10):    
    keep_running = True
    i = 0
    eof = False
    while not eof:        
        x = random.random()
        eof = (i < max_n) & (x <= threeshold)
        if not eof:
            yield x
        i+=1
    #print("Condición de término alcanzada")
            
gen = seq_generator(threeshold=0.5,max_n=10)
for i in gen:
    print(i)

0.5865461067371414
0.7005391451368486


# 5. Programación Orientada a Objetos

- POO es un paradigma de programación que introduce el concepto de objeto como métafora de una entidad real del dominio del problema (por ejemplo Auto, Empleado, Transacción, etc.).
- Cada objeto es la instanciación de una clase que define un conjunto de métodos y propiedades.

In [45]:
class Person():
    # constructor
    def __init__(self, name, age):
        self.name = name
        self.age = age
    
    def greet(self):
        print("Hola, " + self.name)

In [46]:
person1 = Person(name = "Iron Man", age = 35)
person1.greet()

Hola, Iron Man


In [47]:
person2 = Person(name = "Batman", age = 33)
person2.greet()

Hola, Batman


## 5.1 Herencia, Encapsulamiento y Polimorfismo

#### Herencia

- Define una relación entre dos clases en la que existe una clase padre (parent) y una clase heredera. 
- La clase heredera recibe todas las propiedades y métodos de la clase padre. 
- El objetivo de la herencia es permitir reutilizar el código, definiendo clases de más generales a más específicas sin replicar en las últimas de manera explícita lo resuelto en las anteriores.

In [48]:
class WalkingPerson(Person):
    def __init__(self, name, age):        
        Person.__init__(self, name, age)
    
    def walk(self):
        print("My name is {} and I'm walking".format(self.name))    

In [49]:
person3 = WalkingPerson( name ="Usain", age=32 )
person3.walk()
person3.greet()

My name is Usain and I'm walking
Hola, Usain


#### Encapsulamiento

El encapsulamiento se utiliza para restringir el acceso a métodos y variables estableciendo el concepto de privacidad. En Python se prefijan los métodos y atributos privados con '__'.

In [50]:
class Car:    
    __max_speed = 10
    def __init__(self):        
        self.__update_software()
        
    def drive(self):
        print('driving')

    def __update_software(self):
        print('updating software')
        __max_speed = 20

In [51]:
car = Car()
car.drive()
car.__update_software() # Falla

updating software
driving


AttributeError: 'Car' object has no attribute '__update_software'

#### Polimorfismo

El polimorfismo permite definir métodos en una clase base y re-implementarlos de distinta manera pero con el mismo nombre en las clases herederas, logrando un comportamiento distinto dependiendo de la instancia en la que se invocan.

In [53]:
class Vehicle:
    def __init__(self,*args,**kwargs):
        pass
    
    def throttle(self,value):
        raise NotImplemented
    
    def steer(self,angle):
        raise NotImplemented

class Car(Vehicle):
    def __init__(self,*args,**kwargs):
        pass
    
    def throttle(self,value):
        print("Throtttling car")
    
    def steer(self,angle):
        print("Steering car")
        
class Airplane(Vehicle):
    def __init__(self,*args,**kwargs):
        pass
    
    def throttle(self,value):
        print("Throtttling airplane")
    
    def steer(self,angle):
        print("Steering airplane")

In [54]:
def drive_vehicle(vehicle):
    print("Driving a {}".format(type(vehicle)))
    vehicle.throttle(1)
    vehicle.steer(0.45)
    
drive_vehicle(Car())    
drive_vehicle(Airplane())    

Driving a <class '__main__.Car'>
Throtttling car
Steering car
Driving a <class '__main__.Airplane'>
Throtttling airplane
Steering airplane


#### UML

- UML (Unified Modelling Language) es una forma estándar de documentar distintas etapas del ciclo de vida del SW.
- Veremos algunos diagramas para documentar la arquitectura del SW.

### Patrones de Diseño

- Los patrones de diseño son formas estudiadas de resolver problemas conocidos de arquitectura de SW para mejorar su organización y mantenibilidad. 
- [Artículo Wikipedia sobre Patrones de Diseño](https://es.wikipedia.org/wiki/Patr%C3%B3n_de_dise%C3%B1o)

> In scikit-learn, classical learning algorithms are not the only objects to be
> implemented as estimators. For example, preprocessing routines (e.g., scaling of
> features) or feature extraction techniques (e.g., vectorization of text documents)
> also implement the estimator interface. Even stateless processing steps, that do
> not require the fit method to perform useful work, implement the estimator
> interface. As we will illustrate in the next sections, this design pattern is indeed
> of prime importance for consistency, composition and model selection reasons.

Fragmento de "Estimadores en SKLearn". Fuente: [API design for machine learning software:
experiences from the scikit-learn project](https://mblondel.org/publications/lbuitinck-ecmlpkdd2013.pdf)

# 6. Complejidad

- No es el foco de este curso estudiar la complejidad de los algoritmos.
- En caso de que sea de interés para alguna comparativa de métodos, se pueden usar las directivas %timeit y %prun.

In [55]:
%timeit sum(range(10))

507 ns ± 5.81 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [56]:
%prun  sum(range(100))

 

# 7. Manejo de errores y debugging

#### Manejo de excepciones. try/except

Encerrar las sentencias que pueden fallar en bloques try/except simplifica la identificación y contención de los errores.

In [57]:
try:
    1 / 0 # arroja ZeroDivisionError
except ZeroDivisionError:
    print("División por cero")
    pass

División por cero


También puede evitarse incurrir en algunos errores con validaciones sencillas usando asserts.

**Tip**: Cuando se trabaja con matrices/tensores de muchas dimensiones, puede ser útil chequear que el tamaño esperado luego de cada operación sea el esperado.

In [58]:
a = 1
assert a > 0 and a < 2

Por último, se puede acceder al modo debug con *%pdb on/off* o *%debug*.

In [59]:
%pdb on
#exit para salir de pdb
def my_broken_function(a,b):
    c = a + b / 0 # arroja ZeroDivisionError
    return c    

my_broken_function(2,1)

Automatic pdb calling has been turned ON


ZeroDivisionError: division by zero

> [0;32m<ipython-input-59-b230de90e267>[0m(4)[0;36mmy_broken_function[0;34m()[0m
[0;32m      2 [0;31m[0;31m#exit para salir de pdb[0m[0;34m[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      3 [0;31m[0;32mdef[0m [0mmy_broken_function[0m[0;34m([0m[0ma[0m[0;34m,[0m[0mb[0m[0;34m)[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 4 [0;31m    [0mc[0m [0;34m=[0m [0ma[0m [0;34m+[0m [0mb[0m [0;34m/[0m [0;36m0[0m [0;31m# arroja ZeroDivisionError[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      5 [0;31m    [0;32mreturn[0m [0mc[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      6 [0;31m[0;34m[0m[0m
[0m
ipdb> print(a)
2
ipdb> print(b)
1
ipdb> exit


In [60]:
%pdb off

Automatic pdb calling has been turned OFF


In [61]:
my_broken_function(2,1)

ZeroDivisionError: division by zero

In [None]:
%debug

# 8. Organización del código en módulos

(ver en editor)

## Bibliografía y referencias

- Sci-Py Lectures https://scipy-lectures.org/. Accedido: 24/01/2021
- "PyOHIO 2013. Super Advanced Python". https://pyvideo.org/pyohio-2013/super-advanced-python.html