# Estructuras de Datos en Python

En este Notebook vamos a aprender sobre estructuras de datos en Python y sus utilidades

- List
- Tuple
- Dict
- Set
- Función open
- Transformar archivo json a dict
- Manejo de estructuras de datos
- Manejo de archivos

El objetivo es aprender sobre estas estructuras y como usarlas para facilitar nuestro trabajo con los datos.




# List

Las lista son estrucutruas simples que sirven para almacenar diferentes tipos de datos


```
first_list = ['Tommy','John','Arthur']
```
Las principales caractetisticas de una lista son:


- Valores ordenados (parte en index 0 y así continua)



```
first_list = ['Tommy','John','Arthur']
print(first_list[0]) # Tommy
print(first_list[1]) # John
print(first_list[2]) # Arthur
```

- Si se agrega un nuevo valor este se agrega al final (Se usa el comando append)

```
first_list = ['Tommy','John','Arthur']
first_list.append('Michael')

print(first_list[3]) # Michael (toma el siguiente valor en la lista)
```

- Modificables


```
first_list = ['Tomy','John','Arthur']
fist_list[0] = 'Tommy'
print(first_list[0]) # Tommy
```


- Permite Duplicados


```
first_list = ['Tommy','Tommy','Tommy','John','Arthur'] 
# Esto no genera problemas
```







In [None]:
#Para probar códigos

# Tuple

Las tuplas son estrucutruas de datos simples que sirven para almacenar diferentes tipos de datos con un orden especifico y que **NO** pueden ser modificadas


```
first_tuple = ('Tommy','John','Arthur')
```
Las principales caractetisticas de una tupla son:


- Valores ordenados (parte en index 0 y así continua)



```
first_tuple = ('Tommy','John','Arthur')
print(first_tuple[0]) # Tommy
print(first_tuple[1]) # John
print(first_tuple[2]) # Arthur
```

- No permite agregar nuevos valores

```
first_tuple = ('Tommy','John','Arthur')
first_tuple.append('Michael') # Esto devuelve error

```

- Modificables


```
first_tuple = ('Tomy','John','Arthur')
fist_tuple[0] = 'Tommy' # Esto devuelve error
```


- Permite Duplicados


```
first_tuple = ('Tommy','Tommy','Tommy','John','Arthur')
# Esto no genera problemas
```







In [None]:
#Para probar códigos


# Set

Los set son estrucutruas de datos simples 


```
first_set = {'Tommy','John','Arthur'}
```
Las principales caracteristicas de Set son:

- No tiene un orden definido

```
print(first_set[0]) # Esto devuelve error
```
- No se pueden modificar los datos, pero si se pueden agregar nuevos usando add()



```
first_set.add('Michael')
print(first_set) # {'Tommy','John','Arthur','Michael}
```

- No permite duplicados



```
first_set = {'Tommy','John','Arthur','Tommy'}
print(first_set) # {'Tommy', 'John', 'Arthur'}
first_set.add('Michael')
first_set.add('Michael')
print(first_set) # {'Michael', 'Arthur', 'Tommy', 'John'}
```








# Dictionaries

Los Dict son una estructura de datos que permite usar el formato key-value



```
first_dict = {
  'first_brother': 'Arthur',
  'second_brother': 'Tommy',
  'third_brother': 'John',
}

peaky_dict = {
  'first_name': 'Tommy',
  'last_name': 'Shelby',
  'age': 39,
  'nationality': 'English',
  'family': ['Arthur','John','Poly'],
  'married': True
}
```
- No tiene orden, pero se puede acceder en base a la key del dict

```
print("Nombre: " + peaky_dict['first_name'] + " " + peaky_dict['last_name']) 
print(first_dict[0]) # Esto devuelve error
```

- Es modificable



```
print("Edad: " + str(peaky_dict['age']))
peaky_dict['age'] = peaky_dict['age'] + 1
print("Edad: " + str(peaky_dict['age']))
```
- No permite duplicados



```
peaky_dict = {
  'first_name': 'Tommy',
  'first_name': 'Tommy', # esto se borra al momento de hacer print
  'last_name': 'Shelby',
  'age': 39,
  'nationality': 'English',
  'family': ['Arthur','John','Poly'],
  'married': True
}

print(peaky_dict)
# {'first_name': 'Tommy', 'last_name': 'Shelby', 'age': 39, 'nationality': 'English', 'family': ['Arthur', 'John', 'Poly'], 'married': True}
```





# Función Open

La función open() es fundamental en el manejo de datos porque nos permite abrir archivos de forma simple.



```
file = open("")
```



In [None]:
# archivo txt con personajes de Harry Potter
file1 = open('/Users/cristobalugarte/code/uai/bootcamp/bootcamp 2022-1/clase2 - Estructuras y OOP/harrypotter.txt','r')

# Muestra todo el archivo
print(file1.read()) 


# archivo json con sample data que viene en colab
file2 = open('/content/sample_data/anscombe.json','r')

print(file2.read())

# archivo csv con sample data que viene en colab
file3 = open('/content/sample_data/california_housing_test.csv','r')

print(file3.read())

Existen distintos tipos de archivos y open() sirve para ir viendo su información

- r es para leer el archivo
- a abre el archivo y me permite agregarle datos
- w abre el archivo y permite escribir información
- x crea el archivo en el servidor


Podemos decidir cuantos caracteres ver en el comando read()
```
file = open('example.txt','r')
print(f.read(10)) # 10 caracteres
```

Podemos leer las lineas del archivo una por una



```
file = open('example.txt','r')
print(f.readline()) # Primera Linea
print(f.readline()) # Segunda Linea
print(f.readline()) # Tercera Linea
print(f.readline()) # Cuarta Linea
```

Para poder revisar la información de forma dinamica podemos usar for

```
file = open('example.txt','r')
for line in file:
  # Hacer las funciiones que uno quiera
  print(line)
```










# JSON a Dict

JavaScript Object Notation (JSON) es un formato basado en texto estándar para representar datos estructurados en la sintaxis de objetos de JavaScript. Es uno de las estructuras de datos más usadas en la web y muchas veces las APIs devuelven la información en este formato.



In [None]:
import json
# Necesitamos traer las funciones para trabajar con json

file = open('/content/sample_data/anscombe.json','r')

json = json.load(file)

print(json)

[{'Series': 'I', 'X': 10.0, 'Y': 8.04}, {'Series': 'I', 'X': 8.0, 'Y': 6.95}, {'Series': 'I', 'X': 13.0, 'Y': 7.58}, {'Series': 'I', 'X': 9.0, 'Y': 8.81}, {'Series': 'I', 'X': 11.0, 'Y': 8.33}, {'Series': 'I', 'X': 14.0, 'Y': 9.96}, {'Series': 'I', 'X': 6.0, 'Y': 7.24}, {'Series': 'I', 'X': 4.0, 'Y': 4.26}, {'Series': 'I', 'X': 12.0, 'Y': 10.84}, {'Series': 'I', 'X': 7.0, 'Y': 4.81}, {'Series': 'I', 'X': 5.0, 'Y': 5.68}, {'Series': 'II', 'X': 10.0, 'Y': 9.14}, {'Series': 'II', 'X': 8.0, 'Y': 8.14}, {'Series': 'II', 'X': 13.0, 'Y': 8.74}, {'Series': 'II', 'X': 9.0, 'Y': 8.77}, {'Series': 'II', 'X': 11.0, 'Y': 9.26}, {'Series': 'II', 'X': 14.0, 'Y': 8.1}, {'Series': 'II', 'X': 6.0, 'Y': 6.13}, {'Series': 'II', 'X': 4.0, 'Y': 3.1}, {'Series': 'II', 'X': 12.0, 'Y': 9.13}, {'Series': 'II', 'X': 7.0, 'Y': 7.26}, {'Series': 'II', 'X': 5.0, 'Y': 4.74}, {'Series': 'III', 'X': 10.0, 'Y': 7.46}, {'Series': 'III', 'X': 8.0, 'Y': 6.77}, {'Series': 'III', 'X': 13.0, 'Y': 12.74}, {'Series': 'III', 'X

# Manejando Estructuras de Datos

Las estrucutras de datos también se pueden manejar mediante funciones y la idea es que siempre las manejemos de esta forma.


In [None]:
def read(data):
  for value in data:
    print(value)

def data_type(data):

  if type(data) != 'dict':
    for value in data:
      print(type(value))

  else:
    for value in data:
      print(type(data[value]))
  

mylist = ['Tommy','Arthur','John',['Poly','Michael']]
mytuple = ('Walter','Gus','Jessie','Mike','Saul','Hank',1970)
myset = {'Daenerys','Jon','Theon','Bran',('Cersei','Robert')}
mydict = {
  'first_name': 'Tommy',
  'last_name': 'Shelby',
  'age': 39,
  'nationality': 'English',
  'family': ['Arthur','John','Poly'],
  'married': True
}

read(mylist)
print("---")
data_type(mylist)
print("---")
read(mytuple)
print("---")
data_type(mytuple)
print("---")
read(myset)
print("---")
data_type(myset)
print("---")
read(mydict)
print("---")
data_type(mydict)


Tommy
Arthur
John
['Poly', 'Michael']
---
<class 'str'>
<class 'str'>
<class 'str'>
<class 'list'>
---
Walter
Gus
Jessie
Mike
Saul
Hank
1970
---
<class 'str'>
<class 'str'>
<class 'str'>
<class 'str'>
<class 'str'>
<class 'str'>
<class 'int'>
---
Bran
Jon
Theon
Daenerys
('Cersei', 'Robert')
---
<class 'str'>
<class 'str'>
<class 'str'>
<class 'str'>
<class 'tuple'>
---
first_name
last_name
age
nationality
family
married
---
<class 'str'>
<class 'str'>
<class 'str'>
<class 'str'>
<class 'str'>
<class 'str'>
