**Metadata**: Estos notebooks están (más que) inspirados en el excelente trabajo de [Jake van der Plass](https://github.com/jakevdp/) y su [Whirlwind Tour Of Python](https://github.com/jakevdp/WhirlwindTourOfPython). Ver A Whirlwind Tour of Python by Jake VanderPlas (O’Reilly). Copyright 2016 O’Reilly Media, Inc., 978-1-491-96465-1.". Estos notebooks están protegidos con la misma licencia de los originales, [Creative Commons 0](). Todas las notas están disponibles en [PrograUDD](https://github.com/leoferres/prograUDD).

**Nota**: Estos notebooks están basados en la cátedra de programación dirigida por el Excmo. Sr. Dr. [Leo Ferres](https://github.com/leoferres). 
Bajo licencia [Creative Commons 0](). Todas las notas están disponibles en [TallerDataScience](https://github.com/diegocaro/tallerds).

# Objetivos de la clase
1. Elaborar código Python con if/else y loops con numeros y strings.
1. Elaborar código Python usando estructuras de datos list, dict y set.
1. Utilizar funciones y módulos para encapsular procesamiento.
1. Elaborar programas utilizando numpy**.

# Ciclos iterativos

Los loops en Python son una manera de ejecutar código repetidamente. Supongamos que queremos imprimir todos los elementos de una lista:

In [1]:
for k in [2, 3, 5, 7]:
    print(k, end=' ')

2 3 5 7 

Fíjense las partes del loop: el `for`, una variable `k` para mantener estado, el operador de membresía `in` y la lista misma. 

**Es casi lenguaje natural**

La parte más a la derecha del ciclo for (donde está la lista) puede ser cualquier *iterador* (un objeto que podamos "recorrer"), para más información revisar [aqui](http://anandology.com/python-practice-book/iterators.html).

Uno de los iteradores más comunes de Python es la función `range()`, que genera una secuencia de números.

In [2]:
for i in range(10):
    print(i, end=' ')

0 1 2 3 4 5 6 7 8 9 

Noten que siempre las iteraciones empiezan con 0 y que por convención el último elemento del objeto no se incluye (el número "10" en este caso). El objeto `range` puede tomar secuencias (rangos, por eso el nombre) más complicados, por ejemplo:

In [3]:
# range de 5 a 10
list(range(5, 10))

[5, 6, 7, 8, 9]

In [4]:
# range de 0 a 10 de a 2
list(range(0, 10, 2))

[0, 2, 4, 6, 8]

Vocabulario:
- Usaremos la palabra **iterar** cuando se debe ejecutar un ciclo para computar algún valor.

## Ciclos `while`

El otro tipo de ciclo en Python es el `while`, que se ejecuta mientras una condición se cumple.

In [5]:
i = 0
while i < 10: #aquí va la condición
    print(i, end=' ')
    i += 1

0 1 2 3 4 5 6 7 8 9 

## `break` y `continue`

Algunas veces se necesita interrumpir el código

 - `break` detiene el loop
 - `continue` se salta a la siguiente iteración del código

In [6]:
for n in range(20):
    # si el resto es 0, salte lo que queda de la iteración
    if n % 2 == 0:
        continue
    print(n, end=' ')

1 3 5 7 9 11 13 15 17 19 

# Estructuras de datos nativas

Hemos visto los tipos de datos simples de Python: `int`, `float`, `str`, etc. Python también tiene algunas tipos de datos complejos:

| Tipo | Ejemplo                    |Descripción                            |
    |-----------|---------------------------|---------------------------------------|
    | ``list``  | ``[1, 2, 3]``             | colección                     |
    | ``tuple`` | ``(1, 2, 3)``             |colección ordenada inmutable (no se puede actualizar)          |
    | ``dict``  | ``{'a':1, 'b':2, 'c':3}``  | Diccionario (llave,valor) sin orden         |
    | ``set``   | ``{1, 2, 3}``              |Conjunto, colección sin orden objectos únicos |
    
Como ven, lo que define el tipo de objetos son los parentesis, corchetes, y llaves con ciertas pequeñas diferencias.

## Las listas

Una lista es una colección de objetos ordenados de la misma manera en que fueron insertados.
Se definen con los valores separados por comas:


In [7]:
L = [7, 3, 5, 2]

In [8]:
L

[7, 3, 5, 2]

Hay una serie de **métodos** disponibles para las listas, veamos algunos de los más comunes:

(Recordar que un **método** es una mecanismo que permite acceder y modificar el contenido de una variable)

In [9]:
# largo de la lista
len(L)

4

In [10]:
# agregar un elemento a la lista
L.append(11)
L

[7, 3, 5, 2, 11]

In [11]:
# aquí, la operación de suma concatena (une) listas
L + [13, 17, 19]

[7, 3, 5, 2, 11, 13, 17, 19]

In [12]:
# sort() ordena la lista (modifica la posición de los elementos de acuerdo a alguna operación)
L = [2, 5, 1, 6, 3, 4]
L.sort()
L

[1, 2, 3, 4, 5, 6]

Hay muchos más métodos que se encuentran en la [documentación de Python](https://docs.python.org/3/tutorial/datastructures.html).

Las listas pueden contener cualquier clase de objeto, pero guarda como la estructuran y acceden!

In [13]:
L = [1, 'two', 3.14, [0, 3, 5]]

In [14]:
L

[1, 'two', 3.14, [0, 3, 5]]

## Accediendo a elementos de la listas y sublistas

Python tiene un metodo conveniente para acceder a los diversos valores de las listas o a "rangos" de valores. Esto se hace a través de una notación tipo matricial (bueh, donde los subíndices se cambian por corchetes):

In [15]:
L = [2, 3, 5, 7, 11]

De nuevo, Python usa 0-based indexing para acceder a los miembros, eso significa que el primer elemento de la lista está en la posición cero:

In [16]:
L[0]

2

In [17]:
L[1]

3

Los elementos al final de la lista pueden accederse con índices negativos:

In [18]:
L[-1]

11

In [19]:
L[-2]

7

Recordar: 
![indexando listas](https://github.com/jakevdp/WhirlwindTourOfPython/raw/f40b435dea823ad5f094d48d158cc8b8f282e9d5/fig/list-indexing.png)

## Sublistas

La operación de corchetes devuelve solo un elemento. Si queremos obtener una sublista, se debe indicar el rango de elementos que se desea obtener.

In [20]:
# Retorna una lista con los elementos 0, 1 y 2.
L[0:3]

[2, 3, 5]

Si sacamos el 0, se entiende igual "desde el principio de la lista"

In [21]:
L[:3]

[2, 3, 5]

Si dejamos afuera el último índice, se asume el largo de la lista.

In [22]:
L[-3:]

[5, 7, 11]

También como en el "range" podemos especificar un entero más como "salto", tipo:

In [23]:
L[::2]  # equivalent to L[0:len(L):2]

[2, 5, 11]

Si especificamos un "salto" negativo, revertimos la lista:

In [24]:
L[::-1]

[11, 7, 5, 3, 2]

**Vocabulario**:
- Indexing: acceder a un elemento de la lista. Devuelve un elemento.
- Slicing: acceder a un rango de elementos de la lista. Devuelve una sublista.

### Modificando elementos de la lista

No solo podemos usar "indexing" y "slicing" para acceder a elementos, sino también para asignarlos, por ejemplo:

In [25]:
L[0] = 100
print(L)

[100, 3, 5, 7, 11]


In [26]:
L[1:3] = [55, 56]
print(L)

[100, 55, 56, 7, 11]


## Ejercicio

* Asuma que el entregan una lista con números. Diseñe un código que calcule el cuadrado de cada número. El resultado se debe entregar en una lista.


In [27]:
numeros = [1, 2, 99, 101]
cuadrado = []

# su codigo acá

cuadrado # esto debería devolver [1, 4, 9801, 10201]

[]

* Resolver el problema 2 del diagnóstico usando ciclos

In [28]:
notas = [4.0, 6.5, 7.0]
promedio = 0

# su código acá

promedio # esto debería devolver 5.8333333333

0

* Modifique el programa del ejercicio anterior para que tome en cuenta la ponderación de cada nota

In [29]:
notas = [4.0, 6.5, 7.0]
ponderacion = [0.1, 0.3, 0.6]
promedio = 0

# su código acá

promedio # esto debería devolver 6.55

0

## Dict (diccionarios)

Los diccionarios son super flexibles (de hecho los objetos de Python son diccionarios). Sirven para asociar un elemento, con otro. 
Se pueden crear a traves de listas de pares `llave:valor` (`key:value`) entre llaves y separados por `:` (dos puntos) :

In [30]:
numbers = {'one':1, 'two':2, 'three':3}

In [31]:
numbers

{'one': 1, 'three': 3, 'two': 2}

Los elementos del diccionario se pueden acceder a través de corchetes:

In [32]:
numbers['two']

2

También se pueden agregar nuevos elementos al dict:

In [33]:
numbers['ninety'] = 90
print(numbers)

{'one': 1, 'two': 2, 'three': 3, 'ninety': 90}


Los claves y valores de un diccionario también se pueden recorrer con un for:

In [34]:
for key, value in numbers.items():
    print(key,'->', value)

one -> 1
two -> 2
three -> 3
ninety -> 90


En los diccionarios no hay orden. Vean la [documentación](https://docs.python.org/3/library/stdtypes.html) de esta increible estructura de datos.

### ¿Para qué usar diccionarios?
En la listas solo podemos acceder a elementos de acuerdo a su posición, lo que restringe su aplicación. 
Los diccionarios sirven para casos en los que es necesario relacionar un elemento con algo que no es su posición en una colección, por ejemplo:

|                | Clave      |Valor           |
|----------------|------------|----------------|
| Guía de Teléfonos | Nombre | Teléfono |
| Cuenta banacaria  | Nro. Cuenta | Balance |
| Interneta DNS     | Nombre de dominio | Dirección IP |

## Ejercicios

* Le entregan una lista con números entre 0 y 6 representando días de la semana, donde el 0 representa el día lunes y el 6 el día domingo. Usando un diccionario y un ciclo, traduzca la representación numerica a un string indicando el día con palabras.
  * ¿qué clave/valor usará para el diccionario?

In [35]:
dias = [0, 1, 1, 1, 4, 5, 2, 4, 3, 2, 0, 0]
nombre = {} # diccionario con el nombre de los días
salida = [] # agregue aqui los strings

# su codigo aqui

salida # debería devolver ['domingo', 'lunes', 'lunes', 'lunes' .......]

[]

* La moda es un estadístico descriptivo que entrega el valor que más se repite. Calcule la moda de la lista de días (hint: use un diccionario!)
  * ¿Qué elementos usaría como clave y valor?

In [36]:
# su codigo aqui

## Sets (conjuntos)

Los sets son conjuntos (!) no ordenados de elementos únicos (como un set, duh). Se definen como listas (valores separados por comas), pero entre llaves:

In [37]:
primes = {2, 3, 5, 7}
odds = {1, 3, 5, 7, 9}

Igual que los sets matemáticos, a los sets de Python se pueden aplicar operadores como union, interseccion, diferencia, diferencia simétrica, entre otros. Por ejemplo:

In [38]:
# union
primes | odds      # con un operador
primes.union(odds) # con el método

{1, 2, 3, 5, 7, 9}

In [39]:
# intersección
primes & odds             # con un op
primes.intersection(odds) # con un metodo

{3, 5, 7}

In [40]:
# diferencia
primes - odds           # con un op
primes.difference(odds) # con un metodo

{2}

In [41]:
# diferencia simétrica: items que aparecen en un solo set
primes ^ odds                     # con op
primes.symmetric_difference(odds) # con metodo

{1, 2, 9}

Y también se puede chequear si algún elemento pertenece a un conjunto:

In [42]:
2 in primes

True

### ¿Para qué usar sets?

El tipo de dato **set** está específicamente diseñado para responder rápidamente a consultas de conjuntos ( pertenencia, intesección, unión, diferencia, etc...). Úsalo cuando sepas que los elementos no se pueden repetir.


# Más sobre strings (cadenas de texto)

Un string es una cadena de texto. Simplemente usa comillas para crear un nuevo string, por ejemplo:

In [43]:
s = "Hola mundo!"
print(s)

Hola mundo!


Puedes unir dos strings con el operador +, y acceder a la i-ésima letra usando el operador corchete '[ ]'. También se puede devolver un substring utilizando la misma notación que en las listas.

In [44]:
s1 = 'Hola'
s2 = 'Chao'

s1 + s2

'HolaChao'

In [45]:
s1[3] # posiciones comienzan en cero!

'a'

In [46]:
s1[:2]

'Ho'

En Python los strings son inmutables. Eso quiere decir que no se pueden modificar. Por ejemplo, no se puede actualizar una letra dentro de un string:

In [47]:
s = "Mi super string"
s[0] = "m"

TypeError: 'str' object does not support item assignment

Para actualizar el string debes crear uno nuevo. Puedes hacer concatenando (unir) strings:

In [49]:
nuevos = "nuestro" + s[2:]
nuevos

'nuestro super string'

También es posible dividir el string en substrings de acuerdo a un separador. El siguiente código obtiene una lista con las palabras de una frase (separadas por espacio):

In [50]:
s = "Había una vez una gata blanca"
L = s.split()
print(L)

['Había', 'una', 'vez', 'una', 'gata', 'blanca']


Y también se puede concatenar varios strings. En el siguiente código se unen las palabras que están en L con un punto.

In [51]:
".".join(L)

'Había.una.vez.una.gata.blanca'

### Ejercicio
* ¿Cómo imprimir un string al revés? (hint: usa un ciclo o la generación con sublistas 'con espacios'!)

In [None]:
mensaje = 'Hola Mundo!'

# tu codigo aquí

mensaje # debería devolver '!odnuM aloH'

* Resolver el problema 3 del diagnóstico. Para abrir un archivo puede usar la función `open(path)`, por ejemplo:

In [55]:
file = open('clase01/gini_by_country.csv')
for line in file: # este ciclo recorre cada linea del archivo
    print(line)

Slovenia,0.251

Denmark,0.256

Slovak Republic,0.247

Czech Republic,0.257

Iceland,0.246

Norway,0.257

Finland,0.257

Belgium,0.266

Austria,0.274

Germany,0.289

Hungary,0.288

Poland,0.298

Luxembourg,0.284

Korea,0.302

France,0.297

Ireland,0.298

Canada,0.313

Australia,0.337

Italy,0.326

Japan,0.33

New Zealand,0.349

Spain,0.344

Portugal,0.338

Greece,0.339

Latvia,0.35

Lithuania,0.381

United Kingdom,0.356

Israel,0.365

Turkey,0.398

Mexico,0.459

Costa Rica,0.491

Chile,0.454

Estonia,0.346

Netherlands,0.305

Sweden,0.274

Switzerland,0.297

United States,0.394

Brazil,0.47

China (People's Republic of),0.556

India,0.495

Russia,0.376

South Africa,0.62


# Funciones

Hasta ahora hemos estado usando sólo simples "pedazos" de código para hacer nuestros programas.
Una forma más inteligente de ordenar nuestro código de Python es hacerlo aún más leible y **reusable**, agrupando, si se quiere porciones de código en unidades a las que podemos llamar desde distintos puntos del código. Estas unidades se llaman **funciones**. Aqui vamos a ver dos formas de definir funciones: la instrucción `def`, que es útil para cualquier tipo de función, y la notación `lambda`, que es útil para definir pequeñas funciones anónimas dentro del código.

## Usando funciones

Las funciones son bloques de código que tienen un nombre, y a las que se puede llamar usando paréntesis. Ya hemos visto funciones antes. Por ejemplo, `print` es una función:

In [None]:
print('abc')

Aqui, `print()` es el nombre de la función, y `'abc'` es lo que se llama un **argumento** (de la función).

Además de los argumentos, hay lo que se llama **keyword arguments** (argumentos clave) que se especifican por nombre. Uno de estos posibles argumentos con nombre para la función `print()` es `sep`, que le dice a `print()` qué caracter usar para separar los argumentos que va a imprimir cuando hay multiples elementos, por ejemplo:

In [None]:
print(1, 2, 3)

In [None]:
print(1, 2, 3, sep='--')

Cuando se usan argumentos y argumentos con nombre, los argumentos con nombre siempre deben aparecer al final, pero en cualquier orden.

## Intermezzo: documentación y autocompletado en Jupyter Notebook

Si no recordamos para que sirve una función o que argumentos recibe, podemos usar la función de documentación de Jupyter. Para acceder a la documentación de una función presiona **shift+tab** sobre el nombre de una función dentro de una celda de código. Por ejemplo, mueve el cursor sobre la palabra print y presiona shift+enter:

In [None]:
print()

Jupyter también permite autocompletar el nombre de variables y funciones usando la tecla **tab**. Escribe `pri` y presiona tab:

In [None]:
pri

La función de autocomletar también funciona para descubrir los argumentos de una función. Prueba presionando **tab** entre los paréntesis de la función print:

In [None]:
print()

## Definiendo funciones

Las funciones se vuelven útiles cuando empezamos a definir las nuestras, organizando funcionalidad y reusandolas en múltiples lugares del código. En Python, las funciones se definen con la instrucción `def`. Por ejemplo, podemos encapsular una version de Fibonacci de la siguiente manera:

In [None]:
def fibonacci(N):
    # Retorna una lista con los primeros N elementos
    # de la secuencia de Fibonacci
    L = []
    a, b = 0, 1
    while len(L) < N:
        a, b = b, a + b
        L.append(a)
    return L

Ahora ya tenemos una función que se llama `fibonacci` y que toma un solo argumento llamado `N`, hace cosas incontables con este argumento, y retorna un valor. En este caso, la lista de los N primeros números de la serie de Fibonacci.

In [None]:
fibonacci(10)

Para aquellos que sepan algo de lenguajes que son "tipeados" (a los que hay que asignar un tipo de datos a cada variable), verán que no hay información de los tipos asociados a los argumentos o valores de retorno de la función. Las funciones de Python pueden retornar cualquier tipo de objeto de Python, simple (un int, float) o complejo (una lista, dict, set, etc.).

## Funciones anónimas: `lambda`

Además del `def`, hay una manera de definir funciones cortas y específicas:

In [None]:
add = lambda x, y: x + y
add(1, 2)

que es equivalente a

In [None]:
def add(x, y):
    return x + y

Como todo es un objeto en Python, también podemos pasar **funciones como argumento** de otras funciones! Como ejemplo, tomemos algunos datos almacenados en una lista de diccionarios (**ahá!!**):

In [None]:
data = [{'first':'Guido', 'last':'Van Rossum', 'YOB':1956},
        {'first':'Grace', 'last':'Hopper',     'YOB':1906},
        {'first':'Alan',  'last':'Turing',     'YOB':1912}]

Supongamos que queremos ordenar la lista por año de nacimiento. Python tiene una función `sorted` que ordena listas:

In [None]:
sorted([2,4,3,5,1,6]) # equivalente a usar el método sort()

Pero los diccionarios no: tenemos que decirle a la función *cómo* ordenar nuestros datos. Podemos hacer esto especificando una "llave" (key) del diccionario al método `sort`:

In [None]:
# sort alphabetically by first name
sorted(data, key=lambda item: item['first'])

Este sería el código equivalente usando una función tradicional:

In [None]:
def order_by_first(item):
    return item['first']

sorted(data, key=order_by_first)

In [None]:
# sort by year of birth
sorted(data, key=lambda item: item['YOB'])

Aunque podamos haber definido la función lambda con un `def`, hay veces que es más corto y conciso hacerlo de esta manera.

# Resumen de la clase

## Ciclos
  * **for**: recorrer elementos de alguna colección o iterador (ejemplo: recorrer los elementos de una lista).
  * **while**: ejecutar un bloque de código mientras se cumpla alguna condición.
  * **continue**: saltar a la siguiente iteración.
  * **break**: detener el ciclo for o while.
  
## Tipos de datos
  * **list**: colección de elementos, están ordenados según como se insertaron. Se accede con la posición del elemento.
  * **dict**: diccionario, se asocia una clave con algún valor. Se accede a valores solo usando la clave.
  * **set**: lo mismo que un conjunto, elementos no se pueden repetir. 


## ¿Cuándo usar list, dict o set?

  * ¿Necesitas una colección de elementos? Usa una **list**.
  * ¿Necesitas saber si un elemento está en una colección o no, y no es necesario saber en que posición está? (y no necesitas duplicados? Usa un **set**.
  * ¿Necesitasa asociar valores con claves, y luego consultar los valores usando las claves? Usa un **dict**. 

TL/DR: https://stackoverflow.com/questions/3489071/in-python-when-to-use-a-dictionary-list-or-set


## Funciones

Se definen usando la palabra reservada **def**. Si la función es pequeña y concisa, puedes definir una función lambda.

  * Si debes ejecutar el mismo código varias veces, agrúpalo en una función!

# Información opcional

## (opcional) Tuplas

Las tuplas son similares a las listas, se definen con paréntesis en vez de corchetes, pero son **inmutables**, es decir, no se pueden actualizar.

In [None]:
t = (1, 2, 3)
print(t)

Las tuplas tienen un largo y los elementos se pueden extraer igual que las listas con el índice:

In [None]:
len(t)

In [None]:
t[0]

La principal diferencia es que los valores de las tuplas no se pueden cambiar, son inmutables!

In [None]:
t[1] = 4 # esto lo podíamos hacer con la lista

In [None]:
t.append(4)

### ¿ Para qué usar tuplas?
Las tuplas se usan en Python usualmente para devolver (y tomar) el resultado de funciones que devuelven varios valores:

In [None]:
x = 0.125
x.as_integer_ratio()

Y se "agarran" de la siguiente manera:

In [None]:
numerator, denominator = x.as_integer_ratio()
print(numerator / denominator)

También hay un montón de métodos para tuplas, vean la [documentación](https://docs.python.org/3/tutorial/datastructures.html)

## (opcional) Funciones y argumentos por defecto
A veces cuando definimos una función, hay un valore que usamos *la mayor parte del tiempo*, pero también queremos darle al usuario de la función (que puede que no seamos solo nosotros), algo de flexibilidad. En este caso, definimos valores por "omisión" de los argumentos. Consideremos la función `fibonacci` de más arriba. Cómo podríamos hacer que el usuaro eligiera el valor de comienzo? Por ejemplo, así:

In [None]:
def fibonacci(N, a=0, b=1):
    L = []
    while len(L) < N:
        a, b = b, a + b
        L.append(a)
    return L

Con un solo argumento, el resultado de llamar a la función es idéntico al anterior:

In [None]:
fibonacci(10)

Pero ahora podemos usar la función para explorar otros valores:

In [None]:
fibonacci(10, 0, 2)

Si especificamos el nombre de los argumentos, no es necesario respetar el orden en que fueron definidos:

In [None]:
fibonacci(10, b=2, a=0) # equivalente a fibonacci(10, 0, 2)