# Data Analytics

## Estructuras de Datos Básicas

Existen una serie de Estructuras de Datos básicas que utilizaremos: 
* tuple: Una colección de objetos inmutable. Se considera que tiene pocos métodos con los cuales trabajar. 
* list: Una colección de objetos mutable. Se considera que tiene muchos métodos con los cuales trabajar. 
* dict: Una colección de objetos asociados a una key (clave). 
* set: Una colección de objetos con la característica de ser únicos (sin repetición). 

### 1) Estructura tipo "tuple": Se crean utilizando paréntesis y son inmutables

In [2]:
a = (12, 14, 'nombre')  # Creando un tuple

In [3]:
a                       # Explorando el tuple "a"

(12, 14, 'nombre')

In [4]:
type(a)                

tuple

In [7]:
a[0]                    # Podemos hacer indizado (indexing) con tuples
# IMPORTANTE: Recuerda que Python es un lenguage de programación con índizado a base 0, no 1!

12

In [8]:
a[2]

'nombre'

In [9]:
a[3]                     # ¡Traceback! No existe nada en posición [3]

IndexError: tuple index out of range

In [10]:
# ¿Qué significa que los tuples son inmutables? Que son muy difíciles de alterar, por ejem...
a[0] = 20                # Intentemos cambiar lo que se encuentra en [0]... ¡Traceback!

TypeError: 'tuple' object does not support item assignment

### 2) Estructura tipo "list": Se crean utilizando corchetes y son mutables

In [11]:
b = [22, 'apellido', 8]  # Creando un list

In [12]:
type(b)

list

In [13]:
b[0]                     # Podemos realizar indizado (indexing) con list también

22

In [14]:
b[2]

8

In [15]:
type(b[2])               # Dentro de lists (así como tuples) pueden existir objetos de distinto tipo, y podemos verificarlo

int

In [23]:
type(b[1])               # Otro objeto de distinto tipo

str

In [25]:
b[0] = 5                 # las lists, a diferencia de los tuples, son mutables (podemos cambiar su contenido fácilmente)...
b

<font color = 'red'>Lists contienen una serie de métodos muy útiles, los cuales los hacen extremadamente flexibles y muy útiles para muchas aplicaciones en el área de finanzas</font>

In [29]:
b.append('nuevo_str')   # El método .append(y) añade un nuevo objeto "y"
b

[5, 'apellido', 8, 'nuevo_str', 'nuevo_str']

In [31]:
b.remove('nuevo_str')  # El método .remove(x) remueve el primer objeto encontrado que coincida con "x"
b

[5, 'apellido', 8]

In [32]:
b.count('apellido')    # El método .count(z) cuenta cuantas veces ocurre el objeto "z" en la lista

1

In [33]:
b.reverse()            # El método .reverse() revierte el orden de los objetos en la lista

In [34]:
b

[8, 'apellido', 5]

<font color = 'red'>CUIDADO CON LAS OPERACIONES DE ASIGNACIÓN EN LISTAS. Las list son mutables, y una operación de asignación en realidad solo "apunta" hacia la misma referencia; veamos...</font>

In [65]:
w = [0, 8, 22, 34]
w

[0, 8, 22, 34]

In [66]:
x = w                      # Hemos copiado la referencia. 
x

[0, 8, 22, 34]

In [68]:
x[1] = 'Cambiado'          # Hacemos una modificación en la list x[1]
x

[0, 'Cambiado', 22, 34]

In [69]:
w                          # ¡También cambió en w!

[0, 'Cambiado', 22, 34]

In [70]:
from copy import deepcopy # Importamos la función deepcopy

In [71]:
w                         # Desplegamos nuevamente la list w

[0, 'Cambiado', 22, 34]

In [72]:
x                         # Desplegamos nuevamenta la list x

[0, 'Cambiado', 22, 34]

In [74]:
x = deepcopy(w)           # Copia w en x
x

[0, 'Cambiado', 22, 34]

In [75]:
x[1] = 'Otro Cambio'      # Modificamos y desplegamos la list x
x

[0, 'Otro Cambio', 22, 34]

In [76]:
w                         # w no cambió, no es una referencia...

[0, 'Cambiado', 22, 34]

### 3) Estructura tipo "dict": Se crean utilizando llaves, son mutables y sus objetos están asociados a keys

### aqui se puede traer la key y te arroja todos los resultados, y si fuera una lista no te permitiria identificar la key, sino que debes usar el valor en el que se encuentra

In [35]:
c = {'Nombre': 'Miguel', 'Ciudad': 'Monterrey', 'Altura': 1.74} # Creando un dict

In [36]:
type(c)

dict

In [38]:
print(c['Nombre'], c['Altura'])  # Llamando a los objetos por el key al que están asociados

Miguel 1.74


In [39]:
c['Nombre']

'Miguel'

In [40]:
c

{'Nombre': 'Miguel', 'Ciudad': 'Monterrey', 'Altura': 1.74}

In [41]:
c['Ciudad'] = 'Guadalajara'

In [42]:
c

{'Nombre': 'Miguel', 'Ciudad': 'Guadalajara', 'Altura': 1.74}

<font color = 'red'>Dicts también contienen una serie de métodos muy útiles, veamos algunos de ellos...</font>

In [43]:
del c['Altura']  # del elimina el key seleccionado

In [45]:
c.clear()        # El método .clear() elimina todos los objetos dentro del dict

In [46]:
c

{}

In [51]:
c = {'Nombre': 'Miguel', 'Ciudad': 'Monterrey', 'Altura': 1.74} 
c.keys()         # El método .keys() me da todas keys del dict

dict_keys(['Nombre', 'Ciudad', 'Altura'])

In [48]:
c.values()        # Me da todos los valores dentro del dict

dict_values(['Miguel', 'Monterrey', 1.74])

### 4) Estructura tipo "set": Se crean utilizando set() y sus objetos son únicos (sin repetición)

El set no es indexado, entonces no le podemos pedir un valor en específico.

In [2]:
d = set(['ab','ba','ac','ca','bc','cb','cb']) # Creando un set

In [55]:
d   # La segunda "cb" ha desaparecido, porque en un set los objetos son únicos

{'ab', 'ac', 'ba', 'bc', 'ca', 'cb'}

In [56]:
type(d)

set

### se usa para saber los datos sin saber la cantidad de repetición del valor dentro de la base de datos

<font color = 'red'> Una aplicación de los sets es para eliminar objetos repetidos</font>

In [57]:
e = [2,2,2,3,3,3,3,4,4,4,4,5,6]  # Este objeto es un list
type(e)

list

In [61]:
e = set(e)   # Se convierte en un set
type(e)

set

In [62]:
e            # Los valores repetidos han desaparecido

{2, 3, 4, 5, 6}

In [63]:
e = list(e)  # Regresa a list
type(e)

list

In [64]:
e           # Verificando...

[2, 3, 4, 5, 6]