## Listas, tuplas y diccionarios

3 tipos de datos más complejos que los que vimos antes, pero que vamos a utilizar mucho, son:
- Listas: Una lista es una **estructura de datos** que contiene una colección o secuencia de datos. Los datos o elementos de una lista deben ir **separados con una coma** y todo el conjunto entre corchetes. Se dice que una lista es una estructura **mutable** porque además de permitir el acceso a los elementos, pueden suprimirse o agregarse nuevos.
- Tuplas: Una tupla permite tener agrupados un conjunto **inmutable** de elementos, es decir, en una tupla no es posible agregar ni eliminar elementos. Las tuplas se declaran separando los elementos por comas y entre paréntesis.
- Diccionarios: Los diccionarios son objetos que contienen una lista de parejas de elementos. De cada pareja un elemento es la clave, que no puede repetirse, y, el otro, un valor asociado.

Los elementos de las tuplas, listas y diccionarios pueden ser de cualquier tipo de dato


### Conceptos generales de tuplas y listas

In [30]:
tupla = (1, 2.2, 'string', 3,  4, 5.5)

In [31]:
lista = [1, 'aaa', 3.3, 4, 5.5, 6, '7']

In [32]:
a=5

Para acceder a los elementos de una tupla o una lista, debemos utilizas los indices, es decir, la posición en la que se encuentra el elemento.
Los indices empiezan desde 0.
Para acceder a el último elemento, se usa el -1. A el penúltimo -2 y así sucesivamente.

In [None]:
lista[6]

In [34]:
x = 'prueba'

In [None]:
x[0]

In [None]:
lista[-1]

In [None]:
# Accedemos a el primer elemento de la lista
print(f"Primer elemento de la lista: {lista[0]}")

# Accedemos a el último elemento de la lista
print(f"Último elemento de la lista: {lista[-1]}")

# Accedemos a el penúltimo elemento de la lista
print(f"Penúltimo elemento de la lista: {lista[-2]}")

In [None]:
# Accedemos a el primer elemento de la tupla
print(f"Primer elemento de la tupla: {tupla[0]}")

# Accedemos a el último elemento de la tupla
print(f"Último elemento de la tupla: {tupla[-1]}")

# Accedemos a el penúltimo elemento de la tupla
print(f"Penúltimo elemento de la tupla: {tupla[-2]}")

Para ver el largo de una lista, podemos utilizar la funcion len()

In [None]:
print(f"La lista tiene {len(lista)} elementos")

In [None]:
len(lista)

Lo mismo con tuplas

In [None]:
print(f"La tupla tiene {len(tupla)} elementos")

Como dijimos, las listas son objetos mutables. Es decir, que les podemos agregar y quitar elementos:

In [None]:
print(lista)

In [None]:
# Agregamos un elemento a la lista
lista.append('otro elemento')
print(lista)

In [44]:
# Eliminamos un elemento de la lista
lista.remove('aaa')

In [None]:
print(lista)

In [None]:
print(f"La lista ahora tiene {len(lista)} elementos")

Las tuplas son inmutables, por lo que no tienen los métodos append y remove.

### Diccionarios

In [49]:
diccionario = {
    'clave': 'valor',
    'clave2': 'valor_2',
    'clave3': 'valor_3'
}

In [50]:
notas = {'agustin': 5, 'natalia': 2, 'carolina':10}

In [51]:
notas['agustin'] = 7

In [52]:
notas['hernan'] = 10

In [None]:
notas

In [None]:
type(diccionario)

Como vimos anteriormente, los diccionarios son objetos que se forman con claves y valores.
Para acceder a un item del diccionario utilizamos la clave:

In [None]:
print(diccionario['clave'])

In [None]:
print(diccionario['clave2'])

In [None]:
print(diccionario['clave3'])

Podemos agregar nuevas claves a un diccionario:

In [58]:
diccionario['nueva_clave'] = 'nuevo valor'

In [None]:
print(diccionario)

Para conocer todas las claves de un diccionario, podemos usar el método .keys(). Veamos un ejemplo:

In [None]:
print(diccionario.keys())

De que tipo es el objeto que nos retorna diccionario.keys()?

In [None]:
tipo = type(diccionario.keys())
print(f"El tipo de el objeto es: {tipo}")

Para conocer los valores de un diccionario, existe el método .values()

In [None]:
tipo = type(diccionario.values())
print(f"El tipo de el objeto es: {tipo}")

In [None]:
print(diccionario.values())

## Palabras reservadas

En python, asi como en todos los lenguajes de programación, hay palabras reservadas. Estas palabras no podemos utilizarlas como nombres de variables. Vamos a ir descubriendolas mientras aprendamos, pero algunos ejemplos son:

- str
- int
- for
- None
- True
- False
- while
- if
- else

# Funciones

Dijimos que en python podemos definir nuestras propias funciones y reutilizarlas donde querramos.

Como lo hacemos?

Una función en python se define de la siguiente manera:



```
def nombre_de_la_función(parametro1, parametro2):
  ...
  bloque de código
  ...
  return algunValor
```

Una función puede recibir 0 o tantos parámetros como necesitemos y opcionalmente retornar algún valor

Para llamarla simplemente escribimos su nombre y le pasamos los parámetros que necesite (si es que necesita)

Veamos algunos ejemplos:

In [1]:
# Función que no recibe parámetros y no retorna ningún valor
def nuestra_funcion():
  print("Nuestra primer funcion que no retorna nada y simplemente imprime un mensaje")

In [None]:
nuestra_funcion()

In [None]:
# Función que recibe parámetros pero no retorna ningún valor

def otra_funcion(parametro):
  print(f"el parametro toma el valor: {parametro}")

otra_funcion("un valor")
otra_funcion(5)
otra_funcion([1,2,3])

In [4]:
# Función que recibe parámetros y retorna un valor
def suma(a, b):
    return a+b

In [None]:
c = suma(5, 6)
print(c)

##### Docstrings

Es una muy buena práctica, documentar lo que hacemos. Muchas veces otras personas van a ver nuestro código, nuestros análisis en notebooks, etc y no es simple ver el código de otra persona cuando no hay ningún comentario.

Tenemos que acostumbrarnos desde ahora a comentar bien las funciones que hacemos y aprovechar las celdas de texto que nos brindan las notebooks para explicar lo que vamos haciendo.

En python, una forma de describir lo que hace una función es usando docstings. Esto es, una descripción que se pone entre 3 comillas """ al principio de la funcion. Por ejemplo:

In [6]:
def suma(a, b):
  """
  Esta funcion retorna la suma de los valores de a y b.
  Params:
  - a: número a (int)
  - b: número b (int)
  """
  return a + b

Otra buena práctica, es especificar el tipo de dato que esperamos que reciba una función y el tipo de dato que devuelve. Esto se hace de la siguiente forma:

In [7]:
def suma(a: int, b: int) -> int:
  """
  Esta funcion retorna la suma de los valores de a y b.
  Params:
  - a: número a (int)
  - b: número b (int)
  """
  return a + b

Además, cuando definimos una función con docstings, al utilizar la funcion `help`de python, ese docstring se imprime y puede ser muy util para otra persona que quiera usar nuestra función!

In [None]:
help(suma)

-Parametros por defecto

In [9]:
def resta(a=None, b=None):
    if a == None or b == None:
        print("Error, debes enviar dos números a la función")
        return   # indicamos el final de la función aunque no devuelva nada
    else:
      return a-b

#resta()

In [None]:
resta(2,1)

# Ejercicios Extra!

1) Realiza una función llamada `relacion(a, b)` que a partir de dos números cumpla lo siguiente:

Si el primer número es mayor que el segundo, debe devolver 1.
Si el primer número es menor que el segundo, debe devolver -1.
Si ambos números son iguales, debe devolver un 0.


2) Realiza una función `separar(lista)` que tome una lista de números enteros y devuelva dos listas ordenadas. La primera con los números pares y la segunda con los números impares.



# Numpy

Recuerden que siempre pueden tener la documentación a mano cuando necesitan algo: https://numpy.org/doc/stable/


Lo primero que tenemos que hacer siempre que vayamos a usar una librería, es instalarla.

En python, las librerías se pueden instalar con el comando `pip install NombreDeLaLibreria` o en el caso de que estemos en un environment de conda, 'conda install'.

Siempre en la documentación de una librería nos van a explicar como instalarla.

Si instalamos anaconda o usamos google colab, numpy ya viene instalado. Si no, debemos correr el siguiente comando:

In [None]:
!pip install numpy

Vemos que dice: Requirement already satisfied: numpy in /usr/local/lib/python3.7/dist-packages (1.23.5) (la version se ira modificando en el futuro)

Esto quiere decir que ya la teníamos instalada desde antes.

Una vez que instalamos una librería, tenemos que importarla para poder usarla. En python, esto se hace de la siguiente manera:

In [13]:
import numpy as np

La parte que dice `as np` se denomina alias. Esto es para que cuando querramos llamar a la librería, no tengamos que poner su nombre completo y podamos llamarla simplemente con el alias `np`.

## Numpy array

El elemento principal de numpy es el numpy array. Para crear uno hay varias formas, una de ellas es pasándo una lista como parámetro:

In [None]:
lista = [1,2,3,4]
numpy_array = np.array(lista)
print(lista)
print(numpy_array)

En este caso, en el que el array esta compuesto por un rango de números en forma ascendente, numpy nos brinda formas más rapidas de crear un array:

In [None]:
np.arange(4)

Este array empieza desde 0, nuestra lista anterior arrancaba desde 1. ¿ Cómo podremos hacer que el array arranque desde 1 ?
Para responder preguntas de este tipo, la documentación y el comando help() son muy útiles.

Veamos que dice el comando help:

In [None]:
help(np.arange)

Ahora, tratemos de generar un array de 6 elementos que arranque desde el valor 0!

In [None]:
nuevo_array = np.arange( ... ) # COMPLETAR (EJERCICIO)
print(nuevo_array)

### Operaciones sobre listas y arrays de numpy

Otra funcionalidad muy útil que nos provee numpy, es la posibilidad de realizar una operación matemática sobre cada elemento de la lista de una forma muy simple.

Si queremos hacer esto con una lista común de python, vamos a necesitar iterar sobre cada elemento (con un for). Numpy nos ahorra ese paso:

In [None]:
# Al hacerlo sobre una lista, vamos a obtener un error:

[1,2,3] + 1

In [None]:
l = [1,2,3,4,5,6]
l_sum = []
for elem in l:
    elemento = elem +1
    l_sum.append(elemento)
l_sum

In [None]:
# Si queremos hacerlo sobre una lista tenemos que usar list comprehension

l = [1,2,3,4,5,6]
l_sum = [item + 1 for item in l]
l_sum

In [None]:
# Pero sobre un numpy array, lo podemos hacer simplemente sumando un número:

np.arange(1,7) + 1

In [None]:
np.arange(1,7) * 5

### Arrays multidimensionales

Al igual que las listas, los arrays de numpy pueden ser n-dimensionales

In [None]:
n_dimensiones = np.array([[[1,2,3], [4,5,6]],
                          [[7,8,9], [10, 11, 12]]])
n_dimensiones

### Shape

Vimos que los arrays de numpy tienen un atributo que se llama `shape`. Esto nos dice la "forma" que tiene el array. Veamos un ejemplo:

In [None]:
n_dimensiones.shape

El shape de un array puede modificarse con la función reshape() de numpy:

In [None]:
una_dim = np.arange(5)
una_dim

In [None]:
una_dim.shape

In [None]:
# (filas, columnas)
una_dim = una_dim.reshape(5, 1)
una_dim

In [None]:
una_dim = una_dim.reshape(1, 5)
una_dim

### Linspace

La función linspace de numpy, nos permite crear arreglos de una forma similar a arange().

La diferencia con arange() es que en esta función, se crean n elementos igualmente espaciados en un intervalo que definamos.

Por ejemplo, si queremos crear un array de 10 elementos igualmente espaciados entre 0 y 1:

In [None]:
np.linspace(0, 1,10)

Recuerden que siempre se puede usar help!

In [None]:
help(np.linspace)

Y también tenemos documentación: https://numpy.org/doc/stable/reference/generated/numpy.linspace.html

### Zeros y Ones

Numpy también nos permite crear un array de tantos 0s o 1s como querramos

In [None]:
np.ones(10)

In [None]:
np.zeros(10)

O podemos usar la función full() y crear un array con la shape y el valor que querramos:

In [None]:
np.full(shape=(10,10), fill_value=3)

### Acceder a elementos del array

Al igual que una lista, para acceder a los elementos de un array de numpy podemos utilizar el indice de los elementos que querramos o un rango [start:stop:step]

In [None]:
numpy_array

In [None]:
numpy_array[1]

In [None]:
numpy_array[0:3]

### Mask

Muchas veces vamos a tener arrays enormes con datos y queremos filtrarlos. Por ejemplo, de un array queremos obtener todos los números que sean menores a 10.

Para hacer esto en una lista de python, deberíamos iterar sobre toda la lista. Podemos evitarlo usando masks en numpy.

Las masks (o filtros booleanos) se definen como una condición, por ejemplo para el caso en el que queremos saber si un elemento es < 10:

`lista < 10`

Esto nos va a retornar otra lista (con el mismo shape que la lista a la que le aplicamos la mask) pero que va a contener los valores `True` y `False`.

True en los casos que se cumple la condición, False de lo contrario.


In [None]:
lista_a_filtrar = np.arange(100).reshape(10, 10) # Creamos una lista de 100 elementos con shape (10, 10), es decir, 10 filas y 10 columnas
lista_a_filtrar

In [None]:
# Definimos la Mask

mask = lista_a_filtrar < 10
mask

Ahora, la Mask nos retorna otra lista con valores booleanos, pero si queremos usar esto para filtrar (aplicar la mascara), como hacemos?

Es simple, se define de la siguiente manera:

In [None]:
lista_filtrada = lista_a_filtrar[mask]
lista_filtrada

Las máscaras no sirven solo para filtrar, también podemos asignar un valor a los elementos que cumplan la condición. Veamos un ejemplo: Reemplacemos todos los elementos que sean menores a 10 por el numero 10:

In [None]:
lista_elementos = np.arange(20)
mask = lista_elementos < 10
lista_elementos[mask] = 10 # Asignamos el valor "menor" a todos los items que cumplen la condicion
lista_elementos

### Otras funciones

No podemos ver todas las funciones que nos brinda numpy en una clase, pero vamos a ver algunas de las más comunes ya que el resto tiene una sintaxis similar.

Si queremos sumar todos los elementos de un array:

In [None]:
lista_a_filtrar.sum()

In [None]:
lista_a_filtrar

En numpy, las funciones se pueden aplicar por "axis" (eje). Por ejemplo, podemos aplicar la función sum() sobre cada columna:

In [None]:
# Por columnas

lista_a_filtrar.sum(axis=0)

O sobre cada fila:


In [None]:
# Por filas

lista_a_filtrar.sum(axis=1)