# Introducción a python, Estructuras de datos


Una estructura de datos es la forma en la que un lenguaje de programación organiza, administra y almacena los datos con los que trabaja, y que permite acceso rápido a los datos y modificación de los mismos. 

## Listas

Las listas son colecciones de objetos demarcadas por squared brackets `[]` y cuyos elementos están delimitados por comas. Por ejemplo:

In [54]:
a = [1, 2, 3, 4]

Las listas pueden contener, y frecuentemente contienen, varios tipos de datos en una sola lista:

In [55]:
a = [1, "Hola", True]

Para accesar los elementos de una lista, es necesario poner el índice del elemento en squared brackets. En python, como en la mayoría de los lenguajes de programación, los índices comienzan en cero. Por ejemplo, para imprimir el primer elemento de la lista necesitamos llamar el índice 0, y el tercer elemento de la lista, el índice 2:

In [56]:
a = [1, "Hola", True]
print(a[0])
print(a[2])

1
True


En las listas usualmente se almacenan registros, por ejemplo:

`usuario = ['Margarita Pérez', 28, 'margarita@gmail.com', 'Mujer', True]`


Las listas también pueden contener otras listas, y en data science frecuentemente es la forma en la que trabajamos los conjuntos de datos. Imaginemos, por ejemplo, que la siguiente lista es un conjunto de datos con las columnas nombre, edad, correo, sexo y si son fans o no de Luis Miguel:

In [57]:
encuesta = [['Margarita Pérez', 28, 'margarita@gmail.com', 'Mujer', True], 
            ['Milton Pérez', 20, 'milton@gmail.com', 'Hombre', True],
            ['Andrés García', 58, 'Andres@gmail.com', 'Hombre', False],
            ['Gloria Trevi', 38, 'gloria@gmail.com', 'Mujer', True]]

Ahora para accesar el nombre del cuarto registro lo que haremos es lo siguiente:

In [58]:
print(encuesta[3][0])

Gloria Trevi


Pero ¿qué tal que queremos accesar el último dato de la lista, o el penúltimo? ¿es necesario conocer la cantidad de personas encuestadas? no. Para esto python nos da el índice `[-1]` para accesar el último registro. ¿Te imaginas qué necesitamos para accesar el penúltimo y el antepenúltimo registro?

In [59]:
print(encuesta[-1][0])

Gloria Trevi


Las listas en otros lenguajes de programación suelen llamarse `arrays` o arreglos.

### Métodos de listas


#### Actualizando listas

Se actualizan de la misma forma en la que actualizamos una variable, por medio del símbolo de igual que representa asignación. Supongamos que queremos actualizar la edad de Gloria Trevi:


In [60]:
encuesta[-1][1] = 39
print(encuesta[-1])

['Gloria Trevi', 39, 'gloria@gmail.com', 'Mujer', True]


#### Agregando registros con append()

Supongamos que quiero agregar un nuevo registro. Te presento el método append() con él puedes agregar otro elemento al final de la lista:

In [62]:
encuesta.append(['Ali Petisa', 30, "ale@gmail.com", True])
print(encuesta)

[['Margarita Pérez', 28, 'margarita@gmail.com', 'Mujer', True], ['Milton Pérez', 20, 'milton@gmail.com', 'Hombre', True], ['Andrés García', 58, 'Andres@gmail.com', 'Hombre', False], ['Gloria Trevi', 39, 'gloria@gmail.com', 'Mujer', True], ['Ali Petisa', 30, 'ale@gmail.com', True], ['Ali Petisa', 30, 'ale@gmail.com', True]]


#### Borrando registros con del

Supongamos que todo fue un error y que Ali en realidad se quería inscribir a otro club de fans. Borremos su registro:


In [46]:
print(encuesta)
print('borrando el último registro...')
del encuesta[-1]
print(encuesta)

[['Margarita Pérez', 28, 'margarita@gmail.com', 'Mujer', True], ['Milton Pérez', 20, 'milton@gmail.com', 'Hombre', True], ['Andrés García', 58, 'Andres@gmail.com', 'Hombre', False], ['Gloria Trevi', 39, 'gloria@gmail.com', 'Mujer', True], ['Ali Petisa', 30, 'ali@gmail.com', True]]
borrando el último registro...
[['Margarita Pérez', 28, 'margarita@gmail.com', 'Mujer', True], ['Milton Pérez', 20, 'milton@gmail.com', 'Hombre', True], ['Andrés García', 58, 'Andres@gmail.com', 'Hombre', False], ['Gloria Trevi', 39, 'gloria@gmail.com', 'Mujer', True]]


también es posible borrar el último registro con el método pop()

In [47]:
encuesta.pop()

['Gloria Trevi', 39, 'gloria@gmail.com', 'Mujer', True]

In [48]:
print(encuesta)

[['Margarita Pérez', 28, 'margarita@gmail.com', 'Mujer', True], ['Milton Pérez', 20, 'milton@gmail.com', 'Hombre', True], ['Andrés García', 58, 'Andres@gmail.com', 'Hombre', False]]


#### Función len()

Puedes encontrar el tamaño de una lista con esta función: 

In [49]:
len(encuesta)

3

#### Una nota sobre el return

Cada método, o función que le aplicamos a un objeto en python, y en los demás lenguajes de programación, regresa "algo". por ejemplo, .pop() regresa el elemento borrado. No todos los métodos modifican el objeto. Recordemos str() e int() que después de aplicados a una variable no modifican a la misma. Es muy importante tener en cuenta qué cosa está regresando cada función y si modifica o no los objetos con los que estamos trabajando para saber cómo debemos trabajarlos. Ejemplos.

### Buscando ayuda


Utiliza la función help() para encontrar más información sobre listas y sus métodos y ten a la mano la [documentación de python](https://docs.python.org/3/tutorial/datastructures.html)

## Tuples

Los tuples, como las listas, son colecciones de objetos. La diferencia es que son inmutables, es decir, no se pueden cambiar.

Los tuples se declaran de la siguiente formas:

In [50]:
LISTA = [1, 2, 3]
n = 1, 2, 3, "hola", "adios"

t = 1, 2, 3
print(type(t))

r = [1, 2], [3, 4]
print(type(r))

s = (1,2)
print(type(s))


<class 'tuple'>
<class 'tuple'>
<class 'tuple'>


Los tuples se accesan igual que las listas:

In [51]:
print(s[0])

1


Los tuples son inmutables:

In [52]:
s[0] = 20

TypeError: 'tuple' object does not support item assignment

Cuando un tuple contiene un tipo de objeto mutable, este sí puede cambiarse:

In [63]:
un_tuple = ([1, 2], [3, 4])
print(un_tuple[0][0])

un_tuple[0][0] = 450
print(un_tuple)


1
([450, 2], [3, 4])


Lo que no puede cambiarse es el objeto en sí:

In [64]:
print(un_tuple[0])
un_tuple[0] = 120


[450, 2]


TypeError: 'tuple' object does not support item assignment

In [65]:
print(un_tuple)

([450, 2], [3, 4])


__¿Para qué utilizarías los tuples?__

## Diccionarios

Hasta ahora hemos visto colecciones Los diccionarios son colecciones de datos que, en lugar de estar indexada con números como las listas y tuples, están indexadas por llaves. Los diccionarios, así, son colecciones de llaves y valores (keys and values):

In [67]:
usuarios = {
                "Romina": "romina@gmail.com", 
                "Martha": "martha@gmail.com"
            }

print(usuarios["Romina"])

romina@gmail.com


Los diccionarios son más útiles cuando tiene más de un nivel:

In [74]:
usuarios_dic = {
                "Romina": {
                    "email": "romina@gmail.com",
                    "teléfono": 81123456,
                    "sexo": "femenino"
                }, 
                "Martha": {
                    "email": "martha@gmail.com",
                    "teléfono": 81123456,
                    "sexo": "femenino"
                }
            }

#print(usuarios_dic["Romina"])
print(usuarios_dic)

{'Romina': {'email': 'romina@gmail.com', 'teléfono': 81123456, 'sexo': 'femenino'}, 'Martha': {'email': 'martha@gmail.com', 'teléfono': 81123456, 'sexo': 'femenino'}}


Ahora agreguemos otro registro al diccionario:

In [75]:
usuarios_dic["Juliana"] = {
    "email": "juliana@gmail.com",
    "teléfono": 811239976,
    "sexo": "femenino"
}

print(usuarios_dic)

{'Romina': {'email': 'romina@gmail.com', 'teléfono': 81123456, 'sexo': 'femenino'}, 'Martha': {'email': 'martha@gmail.com', 'teléfono': 81123456, 'sexo': 'femenino'}, 'Juliana': {'email': 'juliana@gmail.com', 'teléfono': 811239976, 'sexo': 'femenino'}}


Uso de help()
1. ¿cómo obtengo una lista de todas las llaves?
    - return?
2. ¿cómo actualizo un valor de una llave existente?
    - return?
3. ¿cómo quito una llave/valor específico?
    - return?


Los diccionarios en otros lenguajes de programación suelen llamarse `hashes`.

Puedes encontrar otras estructuras de datos de python [aquí](https://docs.python.org/3/tutorial/datastructures.html). Recomendamos ampliamente leer la documentación.

## Iterando la magia

Todas estas estructuras de datos son enumerables, es decir, son colecciones que pueden enumerarse, y por lo tanto, recorrerse con código para transformarse. Por ejemplo, nuestra lista de la encuesta de fans de Luis Miguel, supongamos que de ella queremos saber solamente las edades, esto lo haremos con un bucle, o un loop: 


In [87]:
encuestas = [['Margarita Pérez', 28, 'margarita@gmail.com', 'Mujer', True], 
            ['Milton Pérez', 20, 'milton@gmail.com', 'Hombre', True],
            ['Andrés García', 58, 'Andres@gmail.com', 'Hombre', False],
            ['Gloria Trevi', 38, 'gloria@gmail.com', 'Mujer', True]]


# ¿cómo accesamos un registro en particular?
#encuestas[1]

# ¿cómo accesamos la edad en el registro?
# encuestas[0]
# encuestas[1]
# encuestas[2]
# encuestas[3]

# len(encuestas)



29
21
59
39
[['Margarita Pérez', 29, 'margarita@gmail.com', 'Mujer', True], ['Milton Pérez', 21, 'milton@gmail.com', 'Hombre', True], ['Andrés García', 59, 'Andres@gmail.com', 'Hombre', False], ['Gloria Trevi', 39, 'gloria@gmail.com', 'Mujer', True]]


In [101]:
for encuesta in encuestas:
    print("procesando edad de persona " + encuesta[0])
    encuesta[1] = encuesta[1] + 1
    print(encuesta[1])
    True
    
    

print("hola ya termina mi iteración")

procesando edad de persona Margarita Pérez
41
procesando edad de persona Milton Pérez
33
procesando edad de persona Andrés García
71
procesando edad de persona Gloria Trevi
51
hola ya termina mi iteración


### Una nota sobre la sintaxis de python. Palabras reservadas e indentación.


##### Palabras reservadas

Python, como casi todos los lenguajes de programación tiene una lista de palabras reservadas. Las palabras reservadas son palabras que tienen un significado especial para el intérprete, y que por ende no podemos utilizar como variables. La lista de palabras reservadas puedes encontrarla [aquí](https://docs.python.org/3/reference/lexical_analysis.html?highlight=reserved#keywords).

Como notarás, python en este editor marca esas palabras con un verde en negritas (checa la diferencia entre for, y print). __for__ e __in__ son palabras reservadas porque el intérprete las usa para ejecutar los loops. Así otras palabras reservadas tienen otras funciones especiales.



In [91]:
a = "in"

SyntaxError: invalid syntax (<ipython-input-91-eecb54146638>, line 1)

##### Indentación

Python tiene como característica para ordenar su código la indentación. El intérprete usa la indentación (el espacio desde el borde izquierdo de la pantalla hasta el caracter que estás digitando) como método para leer el texto. Otros lenguajes usan métodos como el punto y la coma (C, Javascript) o el poner un __end__ a la función (Ruby). Por lo mismo, es muy importante cuidar la indentación apropiada del texto, ya que de tener una indentación incorrecta python nos dara un error de indentación ([TabError](https://docs.python.org/3/library/exceptions.html#TabError)). Veamos algunos ejemplos.


Ejemplo de [javascript](https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Function#Difference_between_Function_constructor_and_function_declaration)

Ejemplo de [ruby](https://ruby-doc.org/core-2.3.3/doc/syntax/methods_rdoc.html)

Ejemplo de [python](https://github.com/ponentesincausa/connectas-scrapping/blob/master/extract.ipynb)


Más información sobre la indentación en python [aquí](https://docs.python.org/3/reference/lexical_analysis.html?highlight=reserved#indentation)

### Sigamos con bucles, pero ahora de diccionarios

Como recordarás, los diccionarios tienen una llave, y un valor. Usemos un iterador para imprimir información de las participantes:


In [None]:
participantes = {
                "Romina": "romina@gmail.com", 
                "Martha": "martha@gmail.com",
                "Valentina": "valentina@gmail.com"
            }

print("imprimiendo el nombre de las participantes")
for participante in participantes:
    print(participante)

__¿Cómo imprimo el correo de las participantes?__

Ahora, trabajemos en un problema clásico de iteradores y returns. Como habrás visto cuando imprimimos las edades de las encuestadas del club de luismi, la función nos regresó en cada línea una de las edades, pero si yo quisiera sacar un promedio de edad necesitaría colocar esa data en una nueva colección, es decir, una nueva lista que contenta sólo las edades de las personas del club de fans para que después podamos analizarlo.

__Ejercicio__. Usando el dataset de las edades de las encuestas del club de fans de Luismi, agrega 7 registros más, y después, utilizando los bucles (o sea los loops) y la función .append() imagina una forma de hacer un loop con una lista nueva con sólo las edades de los encuestados.


__Input__: Lista de luismi con 7 registros más agregados a mano  
__Cómputo__: Haz un loop de ese registro para extraer solamente las edades a una nueva lista  
__Output__: Una lista con las nuevas edades

tip: apóyate del método `.append()`