## üíä P√≠lula de conceptos previos de arquivos en Python

### Rutas absolutas e relativas en Microsoft Windows e GNU/Linux

As√≠ de xeito r√°pido poder√≠amos definir:

- **Ruta absoluta**: Ruta completa, todas as indicaci√≥ns dende cero para chegar √° ruta.
- **Ruta relativa**: Partindo do directorio actual, as indicaci√≥ns para chegar √° ruta.

### Son cuesti√≥ns de formato (de texto)...

Hai diferentes maneiras de po√±er unha ruta (absoluta ou relativa) e que a mesma sexa compatible con Microsoft Windows e GNU/Linux.

A m√°is simple √© po√±endo barras inclinadas / en lugar das invertidas \\

No caso de querer empregar barras invertidas, debemos empregar dobre barra invertida para escapar o car√°cter de escape por defecto, que √© a mesma barra invertida.

 **Exemplo**: `'C:\\Users\\USUARIO\\Downloads\\datasets\\proba.csv'`

Adem√°is debemos detectar o sistema se pretendemos que o noso programa funcione en ambos e pretendemos empregar rutas escritas "a man".

üóíÔ∏è **Nota**: En Microsoft Windows poder√≠amos omitir a letra da unidade nas rutas ¬´absolutas¬ª e coller√≠a por defecto a letra da unidade onde se est√° a executar o script.

‚ö†Ô∏è **AVISO**: Neste exemplo empregaremos rutas absolutas.

In [None]:
import platform
sistema = platform.system()

if sistema.casefold() == 'Windows'.casefold():
    path_base='C:/Users/USUARIO/Downloads/datasets/'
else:
    path_base='/home/usuario/Downloads/datasets/'

### Comparaci√≥n de cadeas de texto

üí° Curiosidade polo m√©todo **casefold()** empregado no c√≥digo de enriba? √â unha boa pr√°ctica para comparar **determinadas** cadeas de texto, podes mirar a documentaci√≥n en: <https://docs.python.org/3/library/stdtypes.html#str.casefold>. B√°sicamente ignora as mai√∫sculas e min√∫sculas e ten en conta cousas como que a dobre ss no alem√°n pode equivaler √°: √ü. O algoritmo de casefold est√° descrito aqu√≠: <https://www.unicode.org/versions/Unicode15.0.0/ch03.pdf>. Se simplemente queres ignorar mai√∫sculas, podes aplicar un **lower()** a ambas cadeas.

Para engadir subdirectorios √° ruta, temos varias opci√≥ns:

#### Suma de cadeas de texto

In [None]:
with open(path_base+'a-coruna.csv') as ficheiro:
    print(ficheiro.readline().rstrip())

üí° Curiosidade do que fai o m√©todo **rstrip()**? B√°sicamente borra os caracteres da cola que lle indiquemos. Se non indicamos ning√∫n, ent√≥n borrar√° os caracteres que sexan de tipo espacio en branco: **espacios** ' ', **tabuladores** '\t' e **novas li√±as** '\n'. <https://www.w3schools.com/python/ref_string_rstrip.asp> e <https://docs.python.org/3/library/stdtypes.html>.

#### Con os.path.join

In [None]:
import os

with open(os.path.join(path_base, 'lugo.csv')) as ficheiro:
    print(ficheiro.readline().rstrip())

Tam√©n existe a librar√≠a **pathlib**: <https://docs.python.org/3/library/pathlib.html>.

#### Con f-string (format string)

Po√±eremos unha f antes das comillas e logo as variables entre chaves {}:

In [None]:
with open(f'{path_base}pontevedra.csv') as ficheiro:
    print(ficheiro.readline().rstrip())

#### Con r-string (raw string)

E se nos po√±emos burros, con r-string tam√©n podemos empregas as barras invertidas sen necesidade de escapalas. O texto non se interpreta, √© tal cual.

In [None]:
with open(r'C:\Users\USUARIO\Downloads\datasets\ourense.csv') as ficheiro:
    print(ficheiro.readline().rstrip())

#### Con fr-string (format e raw)

Tam√©n podemos mezclar ambas combinaci√≥ns para obter o mellor de ambos mundos.


In [None]:
arquivo='ourense.csv'
with open(fr'C:\Users\USUARIO\Downloads\datasets\{arquivo}') as ficheiro:
    print(ficheiro.readline().rstrip())


### C√≥mo crear un arquivo temporal

In [None]:
import os
import tempfile

arquivo_temporal = os.path.join(tempfile.mktemp())
print(arquivo_temporal)

Esto daranos unha ruta a un novo arquivo que non existe cun nome que empezar√° por `tmp` e logo ter√° varios caracteres aleatorios. **Exemplos**: `tmp3yas5ei1`, `tmpvtwvejgk`.

Dependendo do sistema, crear√° o arquivo en distintas ubicaci√≥ns:

- En **Microsoft Windows** no cartafol: `C:\Users\USUARIO\AppData\Local\Temp\`
- En **GNU/Linux** no directorio temporal: `/tmp/`

## Ler arquivos (modo simple)

In [None]:
f = open("tmp.txt", "r")
print(f.read())

## Ler arquivos por li√±as

In [None]:
ficheiro = open('/tmp/tmp.tmp', 'r')

while li√±a := ficheiro.readline():
    print(li√±a.rstrip())

## Escribir (e sobreescribir) nun arquivo

In [None]:
ficheiro = open("tmp.txt", "w")
ficheiro.write("Hola mundo!")
ficheiro.close()

## C√≥mo engadir contido ao final dun arquivo

In [None]:
## Ler arquivos (modo simple)
ficheiro = open("tmp.txt", "a")
ficheiro.write("Outra li√±a!")
ficheiro.close()

## ‚ùó Manexo de erros

In [None]:
import sys

ruta_arquivo="/tmp/tmp.tmp"

try:
  ficheiro = open(ruta_arquivo) #Se engado: 'rb' podo abrir o arquivo en binario
except FileNotFoundError:
    print(f"Non se pode atopar o arquivo: {ruta_arquivo}.")
    sys.exit(1)
except OSError:
    print(f"Erro de sistema abrindo o arquivo: {ruta_arquivo}")
    sys.exit(1)
except Exception as err:
    print(f"Ocorreu un erro desco√±ecido abrindo o arquivo: {ruta_arquivo} Erro: ",repr(err))
    sys.exit(1)
else:
  while li√±a := ficheiro.readline():
    print(li√±a.rstrip())

## Manexo de erros con with

In [None]:
ruta_arquivo="/tmp/tmp.tmp"

with open(ruta_arquivo) as ficheiro:
    while li√±a := ficheiro.readline():
        print(li√±a.rstrip())


#### Tipos de apertura

No **open()** podemos especificar principalmente: **r** (lectura, por defecto), **w** (escritura), **a** (append ou engadir ao final) entre outras.

Tam√©n podemos abrir o arquivo no modo por defecto que √© modo texto (**t**) ou en binario (**b**)


**M√°is informaci√≥n**:

- <https://www.w3schools.com/python/python_file_write.asp>