### Lenguajes - Python
## Cursada 2025
### Archivos. Formatos JSON y CSV

# Pensemos en las siguientes situaciones

¿Qué estructura usamos si queremos: 

-  guardar los puntajes cada vez que jugamos a un juego determinado?,
-  tener un banco de preguntas para que cada vez que realizamos el repaso de clase pueda acotar por temas?,
-  manipular los Python plus de los estudiantes por turnos?

**¿Qué tienen todas estas situaciones en común?**


### <center> Necesitamos una estructura que permita que los datos puedan <span style="color:#cd7815">**persistir** </span>cuando la ejecución del programa finalice.</center>

# Algunas consideraciones antes de empezar

- Lo básico: ¿qué es  un **archivo**?
- ¿Cómo podemos manipular los archivos desde un programa Python?

# Manejo de archivos

- Existen funciones predefinidas.
- Si las operaciones fallan, se levanta una **excepción**.
- Los archivos se manejan como objetos que se crean usando la [función open](https://docs.python.org/3/library/functions.html#open).

# La función [open](https://docs.python.org/3/library/functions.html#open)
<center>
<img src="imagenes/funcion_open.png" alt="Función open" style="width:900px;"/>
</center>

# Veamos algunos  ejemplos

# Caso 1: usamos modo "w"
- ¿De **qué modo** se abre este archivo? ¿Qué significa?
- Luego de la instrucción, ¿**dónde se encuentra** archivo.txt?
- ¿De qué **tipo** es archivo.txt?
- ¿Cuándo puede dar un error esta sentencia?


In [None]:
file1 = open('archivo.txt', 'w')

# Caso 2: usamos modo "x"
- ¿De **qué modo** se abre este archivo? ¿Qué significa?
- Luego de la instrucción, ¿**dónde se encuentra** archivo.txt?
- ¿De qué **tipo** es archivo.txt?
- ¿Cuándo puede dar un error esta sentencia?

In [None]:
file2 = open('archivo.txt', 'x')

# Caso 3: usamos  modo "a"

Veremos este caso más adelante... 

# Caso 4: ¿qué modo estamos usando?

- ¿De **qué modo** se abre este archivo? ¿Qué significa?
- ¿De qué **tipo** es archivo.txt?
- ¿Cuándo puede dar un error esta sentencia?

In [None]:
file3 = open('archivo.txt')

## En realidad [la función open](https://docs.python.org/3/library/functions.html#open) tiene más argumentos:

```python
open(file, mode='r', buffering=-1, encoding=None, 
     errors=None, newline=None, closefd=True, opener=None)
```
- **encoding**: sólo para modo texto. Por defecto, la codificación establecida en las [configuraciones del sistema](https://docs.python.org/3.8/library/codecs.html#module-codecs) 

```python
	notes = open("pp.xxx", "r+", encoding="UTF-8")
```
- En este caso, ¿debería llamarse pp.txt? 
- ¿Cómo sé cuál es la configuración por defecto?

In [None]:
import locale
locale.getlocale()

# ¿Qué pasa cuando el archivo está en otro directorio?
Usamos [pathlib](https://docs.python.org/es/3/library/pathlib.html) descripta en la [PEP 428](https://peps.python.org/pep-0428/): una interfaz orientada a objetos que permite el manejo de rutas.


In [None]:
from pathlib import Path
file_muchachos = Path('ejemplos') / "clase04" / "muchachos.txt"
file_muchachos

# Archivos de texto vs. binarios

In [None]:
the_best_song_file = open(file_muchachos,"rb")
lyrics = the_best_song_file.read()
the_best_song_file.close()

In [None]:
print(lyrics)

In [None]:
type(lyrics)

- El tipo **bytes** es una <span style="color:#cd7815">secuencia inmutable de bytes</span>. 
- Solo admiten caracteres ASCII. 

In [None]:
print(lyrics.decode('UTF-8')[:228])

- <span style="color:#cd7815">El tipo **str** de Python utiliza el estándar [Unicode](https://home.unicode.org/) para representar caracteres.</span>
- Generalmente la codificación predeterminada es **UTF-8**.
    -  UTF significa **Unicode Transformation Format**, y el **8** significa que se utilizan valores de 8 bits en la codificación.

# Una rosa azul ..

<img src="ejemplos/clase04/rosa_azul.jpg" alt="Rosa azul" style="width:200px;"/>

In [None]:
file_rose = Path('ejemplos') / "clase04" / "rosa_azul.jpg"
rose = open(file_rose,"rb")
rose = rose.read()

In [None]:
rose

# ¿Cómo almacenamos datos en un archivo?
El caso más sencillo: vamos a guardar solo texto plano.

In [None]:
file_muchachos = Path('ejemplos') / "clase04" / "muchachos1.txt"

In [None]:
f = open(file_muchachos, 'w')

cad1 = "De los pibes de Malvinas"
cad2 = "Que jamás olvidaré."

f.write("En Argentina nací")
f.write("Tierra del Diego y Lionel")
f.write(cad1)
print(f.write(cad2))

f.close()

- **write(cadena):** escribe *cadena* en el archivo y retorna cantidad de caracteres escritos.
- **close():** cierra el archivo.

# Ahora si: abrimos con modo "a"

- ¿De **qué modo** se abre este archivo? ¿Qué significa?
- Luego de la instrucción, ¿**dónde se encuentra** archivo.txt?
- ¿De qué **tipo** es archivo.txt?
- ¿Cuándo puede dar un error esta sentencia?

In [None]:
f = open(file_muchachos, "a")
f.write("*****************************")
f.write("HOLA QUE TAL")
f.close()

¿Qué pasa si no existe?

In [None]:
file_nuevo_muchachos = Path('ejemplos') / "clase04" / "muchachosNUEVO.txt"

In [None]:
f = open(file_nuevo_muchachos, "a")

# ¿Cómo leemos los datos guardados?

In [None]:
f = open(file_muchachos, 'r')
x = f.read(4)
print(f.read())
x

- **read(cantidad_bytes):** lee *cantidad_bytes* del archivo.
- Si cantidad_bytes es <0 o no está, lee hasta fin de archivo.
- <span style="color:#cd7815">Retorna "" si EOF.</span>

# CONSIGNA: probar en casa

Analizar el siguiente ejemplo que muestra otras formas de leer caracteres desde un archivo de texto.

In [None]:
file_muchachos = Path('ejemplos') / "clase04" / "muchachos.txt"

In [None]:
def by_characters():
    f = open(file_muchachos,"r")
    for x in f.read():
        print(x)
    f.close()

def by_lines():
    f = open(file_muchachos,"r")
    print(f.readlines())
    f.close()

def other_by_lines():
    f = open(file_muchachos,"r")
    for line in f:
        print(line)
    f.close()

In [None]:
def main():
    print('Leo caracteres')
    by_characters()
    print('-' * 20)
    print('Leo lineas')
    by_lines()
    print('-' * 20)
    print('Otra forma')
    other_by_lines()


if __name__ == "__main__":
    other_by_lines()

# En resumen: - modos de apertura  

- **'r'**: modo de lectura (**read**). Abre un archivo para lectura. **El modo por defecto, por lo que puede omitirse.**
    * Si el archivo **no existe**, se genera un error **FileNotFoundError**.
    * **Error**: intentar abrir un archivo que no existe o sin permisos.
- **'w'**: modo de escritura (**write)**. Abre un archivo para escritura.
    * Si el archivo **ya existe, se trunca** (se borra su contenido).
    * **Si no existe, se crea uno nuevo**.
    * **Error**: si no tengo permisos de escritura. Si no es el caso, no hay un error específico al abrir, pero se perderá el contenido del archivo si ya existía.


# En resumen: - modos de apertura  (cont.)

- **'a'**: modo para agregar (**append**). Abre un archivo para **agregar contenido al final**.
    * Si el archivo **no existe, se crea uno nuevo**.
    * **Error**: si el archivo **no tiene permisos de escritura**, se generará un error **PermissionError**.
 
- **'x'**: modo de **creación**. Abre un archivo para escritura, pero **solo si no existe**.
    * Si el archivo **ya existe**, se genera un error **FileExistsError**.
    * **Error**: intentar abrir un archivo que ya existe o si no tenemos permisos de escritura. 


# En resumen: - modos de apertura  (cont.)

- **'r+'**: modo de lectura y escritura (read and write). Abre un archivo para lectura y escritura. **El archivo debe existir**; de lo contrario, se genera un error **FileNotFoundError**.
- **'w+'**: modo de lectura y escritura (write and read). Abre un archivo para lectura y escritura.
    * **Si el archivo ya existe**, se trunca.
    * **Si no existe**, se crea uno nuevo.
- **'a+'**: modo para agregar y lectura (append and read). Abre un archivo para agregar **contenido al final** y también permite la lectura.
    * Si el archivo **no existe**, se crea uno nuevo.
    * Si el archivo **no tiene permisos de escritura**, se generará un error **PermissionError**
- **'x+**: modo de creación. Crea un archivo para lectura y escritura. El archivo no debe existir.
    * Si el archivo **ya existe**, se genera un error **FileExistsError**.

# En resumen: tipos de archivos

- **'b'**: **binario** (binary). Se utiliza al especificar el modo de apertura (por ejemplo, 'rb', 'wb', 'ab') para abrir archivos en formato binario.
- **'t'**: **texto** (text). Se utiliza al especificar el modo de apertura (por ejemplo, 'rt', 'wt', 'at') para abrir archivos en formato texto. **Es el formato por defecto, por lo que puede omitirse.**


# ¿Qué pasa si necesito guardar información que tiene una estructura?

- Pensemos en estos ejemplos:

	- Los puntajes cada vez que juego a un juego. Información tipo: **nombre jugador,  puntaje, fecha.**
	- El banco de preguntas:**tema, enunciado, respuesta correcta.**
	- Los Python plus de los estudiantes por turnos:**turno, nombre, apellido, num_legajo, cantidad_puntos, etc.**

- En estos casos también podría usar un **archivo de texto**. ¿Cómo se les ocurre?


# Algunas posibilidades

```
	
	'Tema: Photograph - Intérprete: Ed Sheeran - Año: 2015'
	---
	Tema: Photograph
    Intérprete: Ed Sheeran
    Año: 2015
	---
	'Photograph-Ed Sheeran-2015'
	'Photograph**Ed Sheeran**2015'

```

-  ¿Pros y contras?	

# Hay otras formas mejores...

# <span style="color:#cd7815">JSON (JavaScript Object Notation)</span>

- Es un **formato de intercambio de datos** muy popular. Por ejemplo:
```
	{ "Tema": "Photograph",
      "Intérprete": "Ed Sheeran",
      "Año": 2015}
    o 
     [{"Tema": "Unintended",
      "Intérprete": "Muse",
      "Año": 1999},
      {"Tema": "Photograph",
      "Intérprete": "Ed Sheeran",
      "Año": 2015}]
```
- [+Info](https://www.json.org/json-en.html)

## ¿Sólo para archivos?

- Veamos este ejemplo: https://sampleapis.com/api-list/movies

Y éste es solo uno de los tantos ejemplos ...

# Módulo json
- Python tiene un módulo que permite trabajar con este formato.
- Para usarlo, debemos importarlo.

In [None]:
import json

- Permite <span style="color:#cd7815">serializar objetos</span>.
    - serializamos con: **dumps()** y **dump()**.
    - deserializamos con: **loads()** y **load()**.
- Más info en: https://docs.python.org/3/library/json.html


# DESAFIO 1
> Queremos guardar en un archivo información de la música que más me gusta.

Vamos a generar un archivo con la siguiente estructura:
- nombre de la banda o intérprete,
- ¿es_solista?
- ciudad y país en donde procede,
- una referencia a su trabajo. 

# Empecemos por los datos

¿Qué estructura de Python les parece mejor para almacenar los datos antes de querer guardarlos en un archivo?


In [None]:
data = [
    {"nombre": "William Campbell", "es_solista": False, "ciudad": "La Plata", "pais": "Argentina", "ref": "www.instagram.com/williamcampbellok"},
    {"nombre": "Marcos Fava", "es_solista": True, "ciudad": "La Plata", "pais": "Argentina", "ref": "https://open.spotify.com/intl-es/artist/2risap4rX5qNM54Gdiiuf1"},
    {"nombre": "Ed Sheeran", "es_solista": True, "ciudad": "Halifax", "pais": "Reino Unido", "ref": "https://open.spotify.com/intl-es/artist/6eUKZXaKkcviH0Ku9w2n3V"},
    {"nombre": "INXS", "es_solista": False, "ciudad": "Sidney", "pais": "Australia","ref": "https://open.spotify.com/intl-es/artist/1eClJfHLoDI4rZe5HxzBFv?si=b-EIpUpNTqqhmM26k6mB4w"},
    {"nombre": "La Ley", "es_solista": False, "ciudad": "Santiago", "pais": "Chile", "ref": "https://open.spotify.com/intl-es/artist/1ZVoRDO29AlDXiMkRLMZSK?si=j22YWc1wQByyODfT25Md7w"},
    {"nombre": "Héroes del Silencio", "es_solista": False, "ciudad": "Zaragoza", "pais": "España", "ref": "https://open.spotify.com/intl-es/artist/3qAPxVwIQRBuz5ImPUxpZT?si=6o_JpVtBQSy44N0lzn_73A"},
    {"nombre": "Panza", "es_solista": False, "ciudad": "Buenos Aires", "pais": "Argentina", "ref": "https://open.spotify.com/intl-es/artist/5FamANEkN5PMHyr3UuvpDd?si=o7dnBnOlRbWq70s39fsBTw"},
    {"nombre": "Adele", "es_solista": True, "ciudad": "Tottenham", "pais": "Reino Unido", "ref": "https://open.spotify.com/intl-es/artist/4dpARuHxo51G3z768sgnrY?si=co6Jp1hyS76SjQfbCEY5Rw"},
    ]

In [None]:
type(data)

In [None]:
file_route = Path('ejemplos') / "clase04" / "musica.json"
music_file = open(file_route, "w")

### Ahora, vamos a guardar nuestros datos en el archivo:

Necesitamos **serializar** el objeto referenciado con **data**: usamos **json.dump**

In [None]:
import json

json.dump(data, music_file)
music_file.close()

# DESAFIO 2
> Queremos visualizar los datos sobre mi música que previamente guardamos.

Ahora necesitamos **deserializar** para trabajar con nuestra lista de diccionarios: usamos **json.load**

In [None]:
#Recordemos que: 
#file_route = Path('ejemplos') / "clase04" / "musica.json"

file = open(file_route, "r")
data = json.load(file)
print(data)
file.close()

¿De qué tipo de **data**?  

In [None]:
type(data)

## Abramos el [archivo](ejemplos/clase04/musica.json) y observemos el dato booleano: ¿algo raro?
- Representación en Python
    - En Python, los valores booleanos se representan con **True** y **False** (con la primera letra en mayúsculas)
- Representación en JSON
    - En JSON, los valors booleanos se representan con **true** y **false** (en minúsculas)


###  Un poco más legible

In [None]:
pretty_data = json.dumps(data, indent=4)
#print(pretty_data)

¿De qué tipo es **pretty_data**?

In [None]:
type(pretty_data)

# En resumen - JSON

El **módulo json** permite acceder a las siguientes funciones:

- **json.dump():** serializa un objeto Python a un objeto en formato JSON que puede almacenarse en un archivo.
- **json.load():** deserializa un objeto JSON almacenado en un archivo a un objeto Python.

In [None]:
file_json = open("tempo.json", "w")
data = [{'first_name': 'Hilda', 'last_name': 'Lizarazu'}, {'first_name': 'Fabiana', 'last_name': 'Cantilo'}]
json.dump(data, file_json)
file_json.close()

In [None]:
file_json = open("tempo.json")
data =  json.load(file_json)
data

# En resumen - JSON (cont.)

El **módulo json** permite acceder a las siguientes funciones:

- **json.dumps():** serializa un objeto Python a un objeto **str**.
- **json.loads():** deserializa un objeto JSON (puede ser str o byte)  a un objeto Python.

In [None]:
data = [{'first_name': 'Hilda', 'last_name': 'Lizarazu'}, {'first_name': 'Fabiana', 'last_name': 'Cantilo'}]
data_str = json.dumps(data)
data_str

In [None]:
data =  json.loads(data_str)
data

### Usa las siguientes tablas de conversión:
- [json-to-Python](https://docs.python.org/3/library/json.html#json-to-py-table) 
- [Python-to-json](https://docs.python.org/3/library/json.html#py-to-json-table)

# CSV: ¿más formatos?


- <span style="color:#cd7815">CSV (Comma Separated Values).</span>
- Es un formato muy común para importar/exportar desde/hacia hojas de cálculo y bases de datos.
- Ejemplo:

```
nombre,es_solista,ciudad,pais,referencia
William Campbell,False,La Plata,Argentina,www.instagram.com/williamcampbellok
Marcos Fava,True,La Plata,Argentina,https://open.spotify.com/intl-es/artist/2risap4rX5qNM54Gdiiuf1
Ed Sheeran,True,Halifax,Reino Unido,https://open.spotify.com/intl-es/artist/6eUKZXaKkcviH0Ku9w2n3V
```
- [+Info](https://docs.python.org/3/library/csv.html) - [PEP 305](https://www.python.org/dev/peps/pep-0305/)

# Datasets

**Antes que nada:** ¿qué es un dataset?

- Hay muchos datasets disponibles de muchas temáticas:
- Datos de gestión de gobiernos:
    - Har un portal de datos de [Argentina](https://datos.gob.ar/dataset), de [CABA](https://data.buenosaires.gob.ar/), de [pcia. de Buenos Aires](https://catalogo.datos.gba.gob.ar/).
    - Datos del [Banco mundial](https://data.world/)
    - Portal [Kaggle](https://www.kaggle.com/)
    - [IMDB](https://www.imdb.com/interfaces/)
    - Y muchos más...

- Muchos son datos abiertos, pero otros... no tanto...
 
- ¡PRESTAR ATENCIÓN  a la licencias y requisitos para su uso!
- Muchos en formato **CSV** y otros en **JSON**

#  Nuestra música en Spotify 

Vamos a trabajar con el archivo: [songs_normalize.csv](https://www.kaggle.com/datasets/paradisejoy/top-hits-spotify-from-20002019)
- Tenemos una copia de la [descripción del dataset](ejemplos/clase04/Detalle_DS_Spotify.txt) en donde se explica a qué se refiere cada campo.

In [None]:
import csv
file_route = Path('ejemplos') / "clase04" / "songs_normalize.csv"

In [None]:
file = open(file_route, "r")
csv_reader = csv.reader(file, delimiter=',')

In [None]:
#encabezado = csvreader.__next__()
header = next(csv_reader)
print(header)

In [None]:
file.close()

# El módulo csv

- Hay que importarlo.
- **csv.reader**: crea un objeto **iterador** que nos permite recorrer las líneas del archivo.
- ¿Por qué incluimos el paŕametro **delimiter**? ¿[Dialectos](https://docs.python.org/3/library/csv.html#csv.Dialect)?


```python
     csv_reader = csv.reader(file, delimiter=',')
```

# DESAFIO 3

> Busquemos cuántos temas hay de Adele en el dataset de Spotify.

Comencemos nuevamente el proceso.

In [None]:
file = open(file_route, "r")
csv_reader = csv.reader(file, delimiter=',')

#header = csvreader.__next__()
header = next(csv_reader)
print(header)

In [None]:
for line in csv_reader:
    if line[0] == "Adele": 
        print(f"{line[1]:<40} {line[17]}")
file.close()

- ¿Cómo se accede a cada dato?
- ¿De qué tipo son header y line?

In [None]:
type(header)

# Otra solución ...

In [None]:
file = open(file_route, "r")
csv_reader = csv.reader(file, delimiter=',')

adele_songs = filter(lambda x:  x[0] == "Adele", csv_reader)
for elem in adele_songs:
        print(f"{elem[1]:<40} {elem[17]}")
    
file.close()

# Otra forma de acceder: csv.DictReader

In [None]:
file = open(file_route, "r")
csv_reader = csv.DictReader(file, delimiter=',')

adele_songs = filter(lambda x:  x["artist"] == "Adele", csv_reader)

for elem in adele_songs:
        print(f"{elem['song']:<40} {elem['genre']}")
    
file.close()

# Hagamos la siguiente modificación a nuestro código:
> Agregar un título al listado: "Adele en Spotify".

In [None]:
file = open(file_route, "r")
csv_reader = csv.DictReader(file, delimiter=',')

In [None]:
adele_songs = filter(lambda x:  x["artist"] == "Adele", csv_reader)
print("***Adele en Spotify")
for elem in adele_songs:
        print(f"{elem['song']:<40} {elem['genre']}")
#file.close()

No nos gusta y queremos agregar una tabulación para que que quede mejor. Modifiquemos y volvamos a ejecutar...

¿Qué observamos?

# Recordemos que ...

> <span style="color:#cd7815">csv_reader es un **iterador**</span> por lo que cuando llegamos al final de la iteración ya no vuelve a comenzar.


En un ejemplo más adelante veremos otra forma de trabajar teniendo en cuenta esto.

# Creamos un archivo csv con nuestra música

- **csv.writer:** retorna un objeto que convierte los datos con los que trabajamos en el programa en cadenas con el formato delimitadas con el separador correspondiente. 

In [None]:
file_route_json = Path('ejemplos') / "clase04" / "musica.json"
file_route_csv = Path('ejemplos') / "clase04" / "musica.csv"

In [None]:
#import csv
#import json

file_json = open(file_route_json)
file_csv = open(file_route_csv, "w")

In [None]:
music = json.load(file_json)
writer = csv.writer(file_csv)

¿Qué contiene **music**? ¿De qué tipo es?

In [None]:
type(music)

In [None]:
# Grabo el encabezado con los nombres de las columnas
writer.writerow(["nombre", "es_solista", "ciudad", "pais", "referencia"])
#Grabo los datos
for elem in music:
    writer.writerow( [elem["nombre"], elem["es_solista"], elem["ciudad"], elem["pais"], elem["ref"] ])

file_json.close()
file_csv.close()

Exploremos el archivo .... [musica.csv](ejemplos/clase04/musica.csv)

#  Ahora lo leemos desde Python

In [None]:
#Recordemos que 
#file_route_csv = Path('ejemplos') / "clase04" / "musica.csv""
file_cvs = open(file_route_csv, "r")
csv_reader = csv.reader(file_cvs, delimiter=',')
for line in csv_reader:
    print(line)
file_csv.close()

¿Notan algo respecto a los datos? Observemos el campo booleano.

# En resumen - CSV 

El **módulo csv** permite acceder a las siguientes funciones:

- **csv.reader(csvfile):** retorma un objeto iterable **reader** para procesar las líneas del archivo csvfile.
- **csv.writer(csvfile):** retorna un objeto **writer**  responsable de convertir los datos del usuario en cadenas delimitadas en archivo csvfile. 

In [None]:
import csv
file_csv = open("tempo.csv", "w")

writer = csv.writer(file_csv)
writer.writerow(['first_name', 'last_name'])
writer.writerow(["Hilda", "Lizarazu"])
writer.writerow(["Fabiana", "Cantilo"])
file_csv.close()

In [None]:
file_csv = open("tempo.csv")
csv_reader = csv.reader(file_csv, delimiter=',')
for line in csv_reader:
    print(line)

# En resumen - CSV (cont.)

El **módulo csv** permite acceder a las siguientes funciones:

- **csv.DicReader(csvfile):** retorna un objeto **reader** pero asigna la información de cada fila a un diccionario cuyas claves se proporcionan mediante el parámetro opcional fieldnames o extraídos de la primera fila. 
- **csv.DictWriter(csvfile):** crea un objeto **writer** pero utilizando un diccionario para generar las fileas en el archivos csvfile.

In [None]:
file_csv = open("tempo.csv", "w")
fieldnames = ['first_name', 'last_name']
writer = csv.DictWriter(file_csv, fieldnames=fieldnames)
writer.writeheader()
writer.writerow({'first_name': 'Hilda', 'last_name': 'Lizarazu'})
writer.writerow({'first_name': 'Fabiana', 'last_name': 'Cantilo'})
file_csv.close()

In [None]:
file_csv = open("tempo.csv")
reader = csv.DictReader(file_csv)
print(list(reader))
for row in reader:
    print(row['first_name'], row['last_name'])



# JSON vs. CSV

- ¿Con qué tipo de datos trabajan? (¿texto o binario?)

- ¿En qué casos usamos archivos en formato json?


- ¿En qué casos usamos archivos en formato csv?


# La sentencia with

La [sentencia with](https://docs.python.org/3/reference/compound_stmts.html#with) crea un objeto denominado **runtime context** o **contexto de tiempo de ejecución** que permite ejecutar un grupo de sentencias bajo el control de un **administrador de contexto** o **context manager**.
¿Qué es esto? 

> <span style="color:#cd7815">Un administrador de contexto  permite asignar y liberar recursos  cuando se desee.</span>

El ejemplo típico se da en  el acceso a archivos, ya que son **recursos externos** a nuestros programas que requieren una gestión adecuada.

In [None]:
with open(file_route_csv)  as file_csv:
    csv_reader = csv.reader(file_csv, delimiter=',') 
    header, data = next(csv_reader), list(csv_reader)
    
print(header)
for line in data:
    print(line)

- ¿Dónde se cierra el archivo?
- ¿Por qué les parece que trabajamos **data** como una lista?

# CONSIGNA: tarea para el hogar 

> Dado el conjunto de datos de Spotify, queremos:

>    1- Guardar en otro archivo, en formato json, las canciones que tienen asignado más de un género.

>    2- Los cinco (5) artistas con más canciones en el dataset durante el año 2019.


In [None]:
# Solución


# Exploremos el siguiente [dataset de películas](https://www.kaggle.com/datasets/disham993/9000-movies-dataset)


In [None]:
file_route = Path("ejemplos") / "clase04" / "mymoviedb.csv"

with open(file_route, "r") as file_csv:
    csv_reader = csv.reader(file_csv)
    header, data = next(csv_reader), list(csv_reader)

In [None]:
header

In [None]:
data[:1]

# DESAFIO 4

> Queremos ver qué películas tienen más de 9980 votos.


Deberíamos trabajar con la columna Vote_Count (columna 4)

In [None]:
movies = filter(lambda x: x[4] > "9980", data)
for movie in movies:
    print(movie[1])

- ¿Hay algún problema?

**Probar en casa:**  convertir a int x[4]. **Spoiler:** da error. ¿Por qué?

# DESAFIO 5

> Queremos ver los idiomas de las películas.



In [None]:
#header

In [None]:
languages = map(lambda x: x[6], data)
print(list(languages))

## ¿Nos interesa que se repita?

In [None]:
languages = set(map(lambda x: x[6], data))

In [None]:
print(languages)

## <center>Notamos que hay datos que no son correctos. </center> 

# <center> Más adelante veremos cómo hay otras formas de procesar estos datasets</center>

# DESAFIO 6

> Queremos descargar el poster de las Spiderman.

In [None]:
data[:1]

In [None]:
spiderman = data[:1][0]
poster_spiderman = spiderman[8]
poster_spiderman

In [None]:
import requests
image_route = Path("ejemplos") / "clase04" / "poster_spiderman.jpg"

image = requests.get(poster_spiderman)
with open(image_route, 'wb') as f:
    f.write(image.content)

> El módulo [request](https://requests.readthedocs.io/en/latest/) permite realizar peticiones HTTP.

En este caso, estamos realizando un GET  de un recurso ubicado en la URL dada: 'https://image.tmdb.org/t/p/original/1g0dhYtq4irTY1GPXvft6k4YLjm.jpg'


# CONSIGNA:  tarea para el hogar 

Dados los módulos de juegos mostrados en la clase, modificar el código para que:

1. Se puedan jugar cada juego en forma independiente o desde el módulo juegos.
2. Si se juega desde el módulo juegos, guardar en un archivo el día, hora en que se jugó cada juego. 

Para la parte 2, deben elegir cuál es la mejor estructura y tipo de archivo  utilizar. 
- Si quieren, subir el código modificado a su  repositorio en  GitHub y compartir el enlace a la cuenta @clauBanchoff Y @sofiamartin.

# Seguimos la próxima ...
