# Clase 1b: Estructura de datos y funciones en Python
Referencia: Capítulo 3 de "Python for Data Analysis", Wes McKinney.

## Estructuras de Datos
Aparte de una variable que tiene un sólo valor, Python posee múltiples estructuras de datos para almacenar información. Estas son algunas de las más básicas que podríamos necesitar.

### Tuplas (`tuple`)
Una tupla es un conjunto fijo de elementos con un orden dado. Se definen con parentesis redondos `(`, `)` o simplemente sin ellos, separando los elementos por coma.

In [2]:
tup = (4, 5, 6)
tup

(4, 5, 6)

Al igual que los tipos básicos,  podemos convertir otros objetos en tuplas con el comando `tuples`

In [7]:
tuple([4, 0, 2])
tup = tuple('perro')
tup

('p', 'e', 'r', 'r', 'o')

Para acceder a u elemento de una tupla, usamos parentesis cuadrados.

**RECORDAR: en python en general las cosas se numeran desde 0**

In [11]:
tup[1]

'e'

También las operaciones básicas aplican sobre las tuplas. Por ejemplo, la suma `+` se considera como la concatenación.

In [17]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

In [18]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

y, como todo objeto en Python, tienen sus propios metodos (en este caso, `.count` y `.index`)

In [29]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

### Listas (`list`)
Similar a la tupla, pero está pensado para que su tamaño sea variable. Es decir, agregar y quitar elementos a la lista. Se define como una tupla pero con paréntesis cuadrados `[` `]`

In [49]:
a_list = [2, 3, 7, None]
tup = ('foo', 'bar', 'baz')
b_list = list(tup)
b_list
b_list = tup
tup = tup + ('H',)
tup
b_list = list(tup)
b_list

['foo', 'bar', 'baz', 'H']

In [63]:
b_list[0] =65
b_list.

[65, 'bar', 'baz', 'H']

In [62]:
gen = range(10)
gen
list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [64]:
b_list.insert?

Se pueden agregar elementos (`.append`), insertar elementos en una posición específica (`.insert`) o sacar elementos con un índice en particular (`.pop`) o sacar un elemento por su valos (`.remove`)

In [65]:
b_list.append('dwarf')
b_list

[65, 'bar', 'baz', 'H', 'dwarf']

In [66]:
b_list.insert(1, 'red')
b_list

[65, 'red', 'bar', 'baz', 'H', 'dwarf']

In [67]:
b_list.pop(2)
b_list

[65, 'red', 'baz', 'H', 'dwarf']

In [75]:
b_list.append('baz')
b_list.append('chao')
b_list


[65, 'baz', 'H', 'dwarf', 'baz', 'chao']

In [77]:
#b_list.append('foo')
#b_list
b_list.remove('baz')
b_list

[65, 'H', 'dwarf', 'chao']

In [78]:
b_list.remove?

También es facil ver si un elemento está en una lista (comando `in`). Por ejemplo, para un ciclo `for`

In [79]:
'dwarf' in b_list

True

In [80]:
'dwarf' not in b_list

False

In [81]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

#### Ordenar (`.sort`)
La listas se pueden ordenar

In [83]:
a = [7, 2, 5, 1, 3]
a.sort()
a

[1, 2, 3, 5, 7]

In [92]:
b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort()
b

['He', 'foxes', 'saw', 'six', 'small']

Tambien podemos pasarle una función para determinar como ordenar. Por ejemplo, el largo del string (`len`)

In [95]:
len('hola amigo')

10

In [96]:
b.sort(key=len)
b

['He', 'saw', 'six', 'foxes', 'small']

#### Slicing
Similar a otros lenguajes (como Matlab), Python permite selecciona un _slice_ de la lista usando la notación `inicio:final`

In [103]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]
seq[3:4]

[7]

In [104]:
seq[3:4] = [6, 3]
seq

[7, 2, 3, 6, 3, 5, 6, 0, 1]

Si omito el inicio o final, se asume

In [106]:
seq[:5]
seq[3:]

[6, 3, 5, 6, 0, 1]

Si uso un número negativo, se hace relativo al otro extremo

In [109]:
seq[-4:]
seq[-6:-2]

[6, 3, 5, 6]

O por ejemplo, de dos en dos

In [111]:
seq

[7, 2, 3, 6, 3, 5, 6, 0, 1]

In [116]:
seq[::-2]

[1, 6, 3, 3, 7]

(aunque posiblemente es mas natural usar la función `reversed`)

In [117]:
list(reversed(seq))

[1, 0, 6, 5, 3, 6, 3, 2, 7]

### Diccionarios (`dict`)
Esta es una gran novedad de python. Permite asociar un llave (_key_) a un valor (_value_). Permite hacer una especie de lista, pero asociado a una llave en particular.  Se definen con llaves `{` `}`

In [118]:
empty_dict = {}
d1 = {'nombre' : 'Eduardo', 'edad' : 43}
d1

{'nombre': 'Eduardo', 'edad': 43}

In [121]:
d1['edad']

43

Para acceder a un elemento, igual que las tuplas y listas, se usa parentesis cuadrado. Pero ojo que a diferencia de antes, no hay un "orden", sino uno accede a la llave (`key`) indicada

In [122]:
d1['nombre']

'Eduardo'

In [124]:
d1['siete'] = 'un entero'
d1

{'nombre': 'Eduardo', 'edad': 43, 7: 'un entero', 'siete': 'un entero'}

In [126]:
d1['apellidos'] = ['Moreno','Araya']
d1

{'nombre': 'Eduardo',
 'edad': 43,
 7: 'un entero',
 'siete': 'un entero',
 'apellidos': ['Moreno', 'Araya']}

In [130]:
d1['apellidos']

['Moreno', 'Araya']

In [131]:
d1['apellidos'][1]

'Araya'

In [132]:
d1['apellidos'][1].upper()

'ARAYA'

In [134]:
d1.values()

dict_values(['Eduardo', 43, 'un entero', 'un entero', ['Moreno', 'Araya']])

Como dijimos, un diccionario tiene llaves y valores. Se puede acceder a ellos con `.keys()` y `.values()`

In [135]:
list(d1.keys())
list(d1.values())

['Eduardo', 43, 'un entero', 'un entero', ['Moreno', 'Araya']]

Puedo actualizar el diccionario ya sea cambiando un elemento especifico o con otro diccionario

In [142]:
d1['edad']=43
d1

{'nombre': 'Eduardo',
 'edad': 43,
 7: 'un entero',
 'siete': 'un entero',
 'apellidos': ['Moreno', 'Araya']}

In [143]:
d1.update({'b' : 'foo', 'nombre' : 'Carlos'})
d1

{'nombre': 'Carlos',
 'edad': 43,
 7: 'un entero',
 'siete': 'un entero',
 'apellidos': ['Moreno', 'Araya'],
 'b': 'foo'}

In [154]:
nombres = ['Sebastian', 'Juan', 'Pedro']
apellido = ['Perez', 'Martinez', 'Perez']
dic = {apellido[i] : nombres[i] for i in range(3)}
dic

{'Perez': 'Pedro', 'Martinez': 'Juan'}

### Conjuntos (`set`)
Como sabemos de álgebra, un conjunto es una coleccion de elementos _únicos_, no ordenados. Se puede definir con llaves `{` `}` o con el comando `set`. Recordar! los elementos son únicos en un conjunto.

In [155]:
set([2, 2, 2, 1, 3, 3])
{2, 2, 2, 1, 3, 3}

{1, 2, 3}

In [158]:
a = {3,4,6,2,1,4,3,2,3,2}
a

{1, 2, 3, 4, 6}

Todas las operaciones básicas de un conjunto están definidas: `.add`, `.remove`, `.union` (`|`), `.intersection` (`&`), `.difference` (`-`), y otras.

In [159]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}

In [161]:
a.union(b)
a | b

{1, 2, 3, 4, 5, 6, 7, 8}

In [162]:
a.intersection(b)
a & b

{3, 4, 5}

In [165]:
{1, 2, 3} == {3, 2, 2, 3, 1}

True

### Estructuras en notación abreviada o expresiones ternarias
Como dijimos, otra ventaja de Python es poder usar `for` of `if` para definir en forma abreviada una lista, tupla o diccionario.

Por ejemplo, para una lista,  notación es:
```[<expresion> for <valor> in <coleccion> if <condicion>]``` 

In [177]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
#[x.upper() for x in strings if len(x) > 2]
strings
strings[0].upper()
[x.upper() for x in strings if len(x) > 2 ]

['BAT', 'CAR', 'DOVE', 'PYTHON']

TODO: Cambiar a upper solo las que tienen largo > 2

In [188]:
[x.upper() if len(x)>2 else x for x in strings]

['a', 'as', 'BAT', 'CAR', 'DOVE', 'PYTHON']

Para diccionarios: `{<llave-expr> : <valor-expr> for <valor> in <coleccion> if <condicion>}`

In [189]:
{val : len(val) for val in strings if val != 'car'}

{'a': 1, 'as': 2, 'bat': 3, 'dove': 4, 'python': 6}

In [190]:
len('perro')

5

## Funciones

Como todo lenguaje, podemos definir funciones propias, que reciben objetos como entrada, y retornan un objeto como salida.  Estas se definen con el comando `def`


In [194]:
def suma(x,y):
    return x+y

In [195]:
suma(4,6)

10

In [196]:
def suma(x,y=1):
    return x+y

In [198]:
suma(4)

5

El orden de los parametros es importante. También podemos agregar parametros con un valor por defecto.

In [205]:
def my_function(x, y, z=1.5):
    if z > 1:
        return z * (x + y)
    else:
        return z / (x + y)

In [210]:
my_function(5, 6, z=0.7)
my_function(3.14, 7, 3.5)
my_function(10, 20)

45.0

Los parametros de las funciones son locales, o sea, se modifican dentro de la función.

In [217]:
def func(a):
    for i in range(5):
        a.append(i)
    return a

In [223]:
b=[2,3]
func(b)

[2, 3, 0, 1, 2, 3, 4]

In [225]:
a

[0, 1, 2, 3, 4]

También una función puede devolver multiples valores o salidas

In [211]:
def f(x):
    out1 = x+1
    out2 = x/2
    out3 = x**2
    return out1, out2, out3

In [213]:
f(2)

(3, 1.0, 4)

In [216]:
a, b, c = f(2)
c

4

TODO: Agregar lo de variables locales y globales

**EJERCICIO**: Genere una función que dado un número, retorna la suma de los números del 1 a ese número, que no son divisibles por 7.

In [229]:
def mi_ejercicio(hasta):
    suma = 0
    for i in range(hasta+1):  # Recordar que range no incluye el ultimo número.
        if i%7 != 0:
            suma = suma + i
    return suma

In [234]:
mi_ejercicio(3)

6

### Funciones anónimas  (Lambda Functions)
Otra gracia de Python es poder expresar en forma compacta una función. Por ejemplo, en vez de definir:

In [235]:
def short_function(x):
    return x * 2

podemos usar la notacion compacta:

In [236]:
equiv_anon = lambda x : x*2

In [237]:
short_function(3)

6

El nombre "funcion anónima" viene del hecho que no necesitamos darle un nombre como en `def`, sino que la usamos para definir algo en solo una linea. Esto es muy util trabajando con datos, porque es muy comun querer aplicar una función a todos los elementos de un arreglo.

por ejemplo, antes usamos ordenamos un conjunto de elementos por su largo pasando como argumento la función `len()`. Ahora podemos hacer cosas mas complejas, por ejemplo, el numero de elementos distintos.

In [238]:
strings = ['foo', 'card', 'bar', 'aaaa', 'abab']

In [240]:
strings.sort(key=len)
strings

['foo', 'bar', 'card', 'aaaa', 'abab']

In [241]:
def mifunc (s):
    return len(set(list(s)))

In [244]:
mifunc('aaaa')

1

In [246]:
strings.sort(key=mifunc)
strings

['aaaa', 'foo', 'abab', 'bar', 'card']

In [247]:
strings.sort(key=lambda x: len(set(list(x))))
strings

['aaaa', 'foo', 'abab', 'bar', 'card']