# Sesión 6 - Archivos

## Conceptos

* Un archivo es una secuencia de bytes, cada byte representa a 8-bits los cuales pueden contener hasta 256 combinaciones en números binarios, por ejemplo, un byte puede ser `00110011` o `11110000`.
* El byte es la unidad mínima de almacenamiento en una computadora, por eso los archivos se miden en bytes en lugar de bits. Cuándo uno crea un archivo en el bloc de notas o la terminal este pesará 1 byte.
* Podemos pensar entonces que los archivos son en realidad tiras o secuencias de bytes que contienen información. Por ejemplo, un texto o una imagen.
* Cuándo un archivo contiene un byte por cada caracter se conoce como **ARCHIVO DE TEXTO PLANO**, a este tipo de archivos se les conoce como archivos de texto o archivos planos, y cualquier editor de texto plano puede abrirlos.
* Cuándo un archivo contiene los bytes bajo algún formato propio, se conoce como **ARCHIVO BINARIO**, a este tipo de archivos se les conoce como archivos binarios o simplemente archivos de extensión, y sólo ciertos programas pueden abrirlos. Por ejemplo, una imagen, un audio, un vídeo, un documento PDF, un archivo comprimido ZIP o RAR, etc.

## Archivos de Texto

* Un archivo de texto se puede entender como una secuncia de caracteres. Incluso los saltos de línea que reconocemos como separaciones entre línea y línea no son más que el caracter `\n`, y los tabuladores el caracter `\t`, por lo que si creamos un archivo en el bloc de notas que contenga dos líneas de texto, en la primera, por ejemplo, el texto `Hola` y en la segunda `Mundo`, sería equivalente al texto `"Hola\nMundo"`.

En Python la función `open(<ruta>, <modo>)` abrirá un archivo desde/hacía la `<ruta>` en el `<modo>` especificados según la siguiente tabla.

Modo | Ejemplo | Descripción
--- | --- | ---
`r` | f = open("datos.txt", "r") | Abre un archivo en modo lectura, podemos usar `f.read()` para leer el contenido.
`w` | f = open("datos.txt", "w") | Abre un archivo en modo escritura, podemos usar `f.write(<texto>)` para escribir el contenido (reemplaza).
`a` | f = open("datos.txt", "a") | Abre un archivo en modo apertura, podemos usar `f.write(<texto>)` para escribir más contenido al final (dónde se quedó el último caracter).
`r+` | f = open("datos.txt", "r+") | Abre un archivo en modo lectura + escritura (no reemplaza).
`w+` | f = open("datos.txt", "w+") | Abre un archivo en modo lectura + escritura (reemplaza).
`rb` | f = open("datos.ext", "rb") | Abre un archivo en modo lectura binaria y en lugar de `<texto>` devuelve `<bytes>`.
`wb` | f = open("datos.ext", "wb") | Abre un archivo en modo escritura binaria y en lugar de `<texto>` usamos `<bytes>`.
`rb+` | f = open("datos.ext", "wb") | Abre un archivo en modo escritura + lectura binaria (no reemplaza).
`wb+` | f = open("datos.ext", "wb") | Abre un archivo en modo escritura + lectura binaria (reemplaza).

Lo que nos devuelve la función `open(...)` es lo que conocemos como un cursor o accesor al archivo, este funciona como un objeto que comunica nuestras intenciones al archivo, por ejemplo, `<contenido> = f.read()`, `f.write(<contenido>)`, `f.close()`, etc.

### Documentación

[https://docs.python.org/3/library/functions.html#open](https://docs.python.org/3/library/functions.html#open)
[https://python-intermedio.readthedocs.io/es/latest/open_function.html](https://python-intermedio.readthedocs.io/es/latest/open_function.html)
[https://www.programiz.com/python-programming/methods/built-in/open](https://www.programiz.com/python-programming/methods/built-in/open)



## Ejemplo - Crear un archivo con algún texto

In [2]:
# Abrimos el archivo data/hello.txt en modo escritura
f = open("data/hello.txt", "w")

# Escribimos el contenido del archivo
f.write("Hola mundo")

# Cerramos el archivo
# ! Es importante cerrar el archivo siempre que no use para no bloquearlo ni mantenerlo en memoria RAM
f.close()

## Ejemplo - Crear un archivo con varias líneas de texto

In [3]:
f = open("data/hello_multiline.txt", "w")

# Equivale a f.write("Hola\nMundo\nEste es un ejemplo de varias líneas")
f.write("Hola")
f.write("\n")
f.write("Mundo")
f.write("\n")
f.write("Este es un ejemplo de varias líneas")

f.close()

## Ejemplo - Crear un archivo que agregue más líneas de texto al final

In [6]:
import datetime

f = open("data/log.txt", "a")

f.write("Sesión de hoy {}\n".format(datetime.datetime.now()))

f.close()

## Ejemplo - Leer el contenido de un archivo de texto

In [7]:
f = open("data/hello.txt", "r")

contenido = f.read()

f.close()

print(contenido)

Hola mundo


## Ejemplo - Leer el contenido de un archivo de texto con múltiples líneas

In [8]:
f = open("data/hello_multiline.txt", "r")

contenido = f.read()

f.close()

print(contenido)

Hola
Mundo
Este es un ejemplo de varias líneas


## Ejemplo - Leer el contenido de un archivo de texto con múltiples líneas por cada línea

In [10]:

f = open("data/log.txt", "r")

# f.readlines() - Devuelve una lista con todas las líneas
# f.readline() - Lee la siguiente línea
# f.readable() - Hay más contenido por leer
for line in f:
    print("Línea: {}".format(line.strip())) # <texto>.strip() - quita los espacios y saltos al principio y final del texto
    
f.close()

Línea: Sesión de hoy 2021-09-13 20:15:59.391806
Línea: Sesión de hoy 2021-09-13 20:16:06.364866
Línea: Sesión de hoy 2021-09-13 20:16:13.344049


## Proyecto: Reporte estadístico de ubicaciones

En archivo `data/ubicaciones.txt` se encuentran las ubicaciones de hospitales por cada línea de texto en el siguiente formato.

> Formato de `ubicaciones.txt`

```txt
<nombre_hospital> <latitud> <longitud>
```

* **Nota:** El `<nombre_hospital>` no contiene espacios.

> Ejemplo del archivo `ubicaciones.txt`

```txt
ABC 98.15 -113.56
AMERICAS 67.43 -112.69
LA_RAZA 56.34 -115.98
```

### Fase 1 - Leer las ubicaciones

Genera un función llamada `leerUbicaciones(<ruta>)` que reciba la `<ruta>` del archivo con el formato anterior (`"data/ubicaciones.txt"`) y devuelva una lista de diccionarios con la siguiete estructura.

> Estructura del diccionario

```py
{
    "nombre": "<nombre_hospital>",
    "latitud": <latitud>,
    "longitud": <longitud>
}
```

> Ejemplo de la lista devuelta por la función `leerUbicaciones("data/ubicaciones.txt")`

```py
[
    {
        "nombre": "ABC",
        "latitud": 98.15,
        "longitud": -113.56
    },
    {
        "nombre": "AMERICAS",
        "latitud": 67.43,
        "longitud": -112.69
    },
    {
        "nombre": "LA_RAZA",
        "latitud": 56.34,
        "longitud": -115.98
    },
]
```

In [11]:
"ABC 123 456".split(" ") # Separar textos mediante el separador " "

['ABC', '123', '456']

In [21]:
def leerUbicaciones(ruta):
    ubicaciones = []
    
    f = open(ruta, "r")
    
    for line in f:
        print("LINE:", line.strip()) # line = "ABC 98.15 -113.56" -> ["ABC", "98.15", "-113.56"]
        
        parts = line.strip().split(" ") # parts = ["ABC", "98.15", "-113.56"]
        print("PARTS:", parts)
        
        nombre = parts[0]
        latitud = float(parts[1])
        longitud = float(parts[2])
        
        ubicacion = {
            "nombre": nombre,
            "latitud": latitud,
            "longitud": longitud,
        }
        print("UBICACIÓN", ubicacion)
        
        ubicaciones.append(ubicacion)
        
    f.close()
    
    return ubicaciones
        
leerUbicaciones("data/ubicaciones.txt")

LINE: ABC 98.15 -113.56 E
PARTS: ['ABC', '98.15', '-113.56', 'E']
UBICACIÓN {'nombre': 'ABC', 'latitud': 98.15, 'longitud': -113.56}
LINE: AMERICAS 67.43 -112.69 F
PARTS: ['AMERICAS', '67.43', '-112.69', 'F']
UBICACIÓN {'nombre': 'AMERICAS', 'latitud': 67.43, 'longitud': -112.69}
LINE: LA_RAZA 56.34 -115.98 E
PARTS: ['LA_RAZA', '56.34', '-115.98', 'E']
UBICACIÓN {'nombre': 'LA_RAZA', 'latitud': 56.34, 'longitud': -115.98}
LINE: GENERAL 45.87 -128.83 F
PARTS: ['GENERAL', '45.87', '-128.83', 'F']
UBICACIÓN {'nombre': 'GENERAL', 'latitud': 45.87, 'longitud': -128.83}


[{'nombre': 'ABC', 'latitud': 98.15, 'longitud': -113.56},
 {'nombre': 'AMERICAS', 'latitud': 67.43, 'longitud': -112.69},
 {'nombre': 'LA_RAZA', 'latitud': 56.34, 'longitud': -115.98},
 {'nombre': 'GENERAL', 'latitud': 45.87, 'longitud': -128.83}]

### Fase 2 - Generar el reporte

Crea una función llamada `generarReporteUbicaciones(<ruta>, <ubicaciones>)` que recibe la `<ruta>` dónde escribiremos el reporte y la lista de `<ubicaciones>` (la lista de diccionarios).

> Ejemplo del reporte

```txt
# Reporte de Ubicaciones de Hospitales

Total de Ubicaciones: 4

Latitud Mínima: 45.87
Latitud Máxima: 98.15

Longitud Mínima: -128.83
Longitud Máxima: -112.69

+------------------------------------------+
| NOMBRE          | LATITUD   | LONGITUD   |
| --------------- + --------- + ---------- |
| ABC             | 98.15     | -113.56    |
| AMERICAS        | 67.43     | -112.69    |
| LA_RAZA         | 56.34     | -115.98    |
| GENERAL         | 45.87     | -128.83    |
+------------------------------------------+
```

In [28]:
def generarReporteUbicaciones(ruta, ubicaciones):
    f = open(ruta, "w")
    
    total = len(ubicaciones)
    
    f.write("Total de Ubicaciones: {}\n".format(total))
    
    lat_min = ubicaciones[0]["latitud"]
    lat_max = ubicaciones[0]["latitud"]
    lon_min = ubicaciones[0]["longitud"]
    lon_max = ubicaciones[0]["longitud"]
    
    for ubicacion in ubicaciones:
        if ubicacion["latitud"] < lat_min:
            lat_min = ubicacion["latitud"]
        if ubicacion["latitud"] > lat_max:
            lat_max = ubicacion["latitud"]
        if ubicacion["longitud"] < lon_min:
            lon_min = ubicacion["longitud"]
        if ubicacion["longitud"] > lon_max:
            lon_max = ubicacion["longitud"]
            
    f.write("\n")
    
    f.write(u"Latitud Mínima: {:.2f}\n".format(lat_min))
    f.write(u"Latitud Máxima: {:.2f}\n".format(lat_max))
    
    f.write("\n")
    
    f.write(u"Longitud Mínima: {:.2f}\n".format(lon_min))
    f.write(u"Longitud Máxima: {:.2f}\n".format(lon_max))
            
    f.write("\n")
    
    f.write("+------------------------------------------------+\n")
    f.write("| NOMBRE               | LATITUD    | LONGITUD   |\n")
    f.write("| -------------------- + ---------- + ---------- |\n")
    for ubicacion in ubicaciones:
        f.write("| {:20} | {:10.2f} | {:10.2f} |\n".format(ubicacion["nombre"], ubicacion["latitud"], ubicacion["longitud"]))
    f.write("+------------------------------------------------+\n")
        
    f.close()
    
generarReporteUbicaciones("data/reporte_ubicaciones.txt", leerUbicaciones("data/ubicaciones.txt"))

LINE: ABC 98.15 -113.56
PARTS: ['ABC', '98.15', '-113.56']
UBICACIÓN {'nombre': 'ABC', 'latitud': 98.15, 'longitud': -113.56}
LINE: AMERICAS 67.43 -112.69
PARTS: ['AMERICAS', '67.43', '-112.69']
UBICACIÓN {'nombre': 'AMERICAS', 'latitud': 67.43, 'longitud': -112.69}
LINE: LA_RAZA 56.34 -115.98
PARTS: ['LA_RAZA', '56.34', '-115.98']
UBICACIÓN {'nombre': 'LA_RAZA', 'latitud': 56.34, 'longitud': -115.98}
LINE: GENERAL 45.87 -128.83
PARTS: ['GENERAL', '45.87', '-128.83']
UBICACIÓN {'nombre': 'GENERAL', 'latitud': 45.87, 'longitud': -128.83}
LINE: OTRO 23.87 -128.83
PARTS: ['OTRO', '23.87', '-128.83']
UBICACIÓN {'nombre': 'OTRO', 'latitud': 23.87, 'longitud': -128.83}
