# Índice

1. Modulos `os` y `pathlib`

2. Input/Output files

3. try/except

4. Buenas prácticas en Python
    

# `os` module

El módulo `os` nos da funcionalidades para hacer tareas en el sistema operativo (Operative System = os). Algunas de esas tareas son las siguientes:

* Navegar por el sistema operativo
* Crear archivos y carpetas
* Eliminar archivos y carpetas
* Modificar archivos y carpetas

In [None]:
import os

dir(os)

¿Cual es nuestro directorio de trabajo?

In [None]:
os.getcwd()

Cambiar el directorio de trabajo:

In [None]:
os.chdir("..")

os.getcwd()

Devolver lista de archivos y directorios:

In [None]:
os.listdir(".")

In [None]:
os.listdir(os.getcwd())

Crear carpetas:

In [None]:
os.chdir("./Sesion 05/")

In [None]:
os.mkdir("prueba1")

In [None]:
os.listdir()

In [None]:
os.mkdir("prueba2/subprueba")

In [None]:
os.makedirs("prueba2/subpruebas")

In [None]:
for root, dirs, files in os.walk("."):
    if dir!= '.git':
        level = root.replace(".", '').count(os.sep)
        indent = ' ' * 4 * (level)
        print('{}{}/'.format(indent, os.path.basename(root)))
        subindent = ' ' * 4 * (level + 1)
        for f in files:
            print('{}{}'.format(subindent, f))

Eliminar carpetas:

In [None]:
os.rmdir("prueba1")

In [None]:
os.listdir()

In [None]:
os.rmdir("prueba2")

In [None]:
os.removedirs("prueba2")

In [None]:
os.removedirs("prueba2/subpruebas/")

In [None]:
os.listdir()

Comprobar si un archivo o directorio existe:

In [None]:
os.path.isdir("./prueba2")

In [None]:
os.path.isdir("Population_Data")

In [None]:
os.path.isfile("Population_Data/Alaska")

In [None]:
os.path.isfile("Population_Data/Alaska/Alaska_population.csv")

Ejemplo útil de procesamiento de datos con el módulo `os`:

In [None]:
os.getcwd()

In [None]:
for root, dirs, files in os.walk("."):
    level = root.replace(".", '').count(os.sep)
    indent = ' ' * 4 * (level)
    print('{}{}/'.format(indent, os.path.basename(root)))
    subindent = ' ' * 4 * (level + 1)
    for f in files:
        print('{}{}'.format(subindent, f))

In [None]:
os.chdir("Population_Data/")

In [None]:
import pandas as pd

# create a list to hold the data from each state
list_states = []

# iteratively loop over all the folders and add their data to the list
for root, dirs, files in os.walk(os.getcwd()):
    if files:
        list_states.append(pd.read_csv(root+'/'+files[0], index_col=0))

# merge the dataframes into a single dataframe using Pandas library
merge_data = pd.concat(list_states[1:], sort=False)
merge_data

In [None]:
os.chdir("..")

# `pathlib` module

`pathlib` es una libreria de Python que se utiliza para trabajar con _paths_. Pero, ¿que es un _path_? _path_ (ruta en castellano) es la forma de referenciar un archivo informático o directorio en un sistema de archivos de un sistema operativo determinado.

Hay dos tipos de _paths_:
* **Absolute paths**: Señalan la ubicación de un archivo o directorio desde el directorio raíz del sistema de archivos.
* **Relative paths**: Señalan la ubicación de un archivo o directorio a partir de la posición actual del sistema operativo en el sistema de archivos.

`pathlib` proporciona una forma más legible y fácil de construir *paths* representando las rutas del sistema de archivos como objetos adecuados.

In [None]:
from pathlib import Path

absolute_path = Path.cwd() / "Population_Data"
relative_path = Path("Population_Data")
print(f"Absolute path: {absolute_path}")
print(f"Relative path: {relative_path}")

In [None]:
absolute_path.is_dir()

In [None]:
relative_path.is_dir()

### ¿Qué ventajas tiene `pathlib` respecto a `os.path`?

In [None]:
alaska_file_os = os.path.join(os.getcwd(), 'Population_Data', "Alaska", "Alaska_population.csv")
alaska_file_os

In [None]:
alaska_file = Path.cwd() / "Population_Data" / "Alaska" / "Alaska_population.csv"
alaska_file

Como podemos observar, el ejemplo de `pathlib` es más claro que el de `os.path`. Además, con `pathlib` se crea un objeto `Path`, que tiene asociado métodos.

In [None]:
os.path.isfile(alaska_file_os)

In [None]:
alaska_file.is_file()

In [None]:
current_dir_os = os.getcwd()
current_dir = Path.cwd()

print(current_dir_os)
print(current_dir)

In [None]:
os.mkdir(os.path.join(current_dir_os, "pruebaos"))
(current_dir / "pruebalib").mkdir()

In [None]:
os.rmdir(os.path.join(current_dir_os, "pruebaos"))
(current_dir / "pruebalib").rmdir()

La conclusióne es que si podeís usar `pathlib` lo utilizeis porque aunque se puede obtener el mismo resultado con `os.path`, el código es más fácil de leer con `pathlib`.

# Input/Output files

Si ya hemos visto que los módulos como `numpy` o `pandas` tienen funciones para abrir archivos de diferentes tipos, ¿por qué nos interesa ahora aprender otra manera de trabajar con archivos?

Con esas librerias, los archivos que leiamos tenían que tener un tipo de estructura clara. En cambio, con estos métodos que vamos a proporner, no necesitamos que el archivo que vayamos a leer tenga una estructura tan clara.

Además, saber leer, escribir y guardar nuestras salidas en archivos puede ser útil. Aunque con `prints` podriamos hacer lo mismo, el problema es que lo que printeamos con print se guarda en la RAM y cuando cerramos Python, todos lo que habiamos mostrado desaparece.

Para abrir un archivo usaremos la función `open()`. Hay dos formas de usar la función:

In [None]:
nombre = "Juan"
edad = 22

with open("texto.txt", "w", ) as f:
    f.write(f"Mi nombre es {nombre} y tengo {edad} años")
f.close()

In [None]:
nombre = "Ana"
edad = 23

f = open("texto.txt", "a")
f.write(f"\nMi nombre es {nombre} y tengo {edad} años")
f.close()

Estamos pasandole dos argumentos a la función `open()`. El primer argumento es una cadena que contiene el nombre del fichero. El segundo argumento es otra cadena que contiene unos pocos caracteres describiendo la forma en que el fichero será usado. mode puede ser `'r'` cuando el fichero solo se leerá, `'w'` para solo escritura (un fichero existente con el mismo nombre se borrará) y `'a'` abre el fichero para agregar.; cualquier dato que se escribe en el fichero se añade automáticamente al final. `'r+'` abre el fichero tanto para lectura como para escritura. El argumento mode es opcional; se asume que se usará `'r'` si se omite. 

Además de esos dos argumentos, también le podemos pasar otros argumentos importantes como `encoding` por ejemplo.

Al usar el primer método, no tenemos porque cerrar el archivo expicitamente porque con el `with` Python se encarga de cerrarlo. En cambio, si usamos el segundo método tenemos que cerrarlo nosotros con el método `close()`.

Con el método `write` hemos añadido el texto al fichero que hemos abierto con un modo que nos permite escribir en el.

Para leer el contenido del archivo usamos el método `read()`.

In [None]:
f = open("texto.txt")
text = f.read(10)
text

In [None]:
text = f.read(20)
text

In [None]:
f.close()

In [None]:
with open("texto.txt") as f:
    text = f.read()
text

In [None]:
print(text)

In [None]:
with open("texto.txt") as f:
    for i, line in enumerate(f):
        print(f"{i+1}ª linea: {line}")

In [None]:
f = open("texto.txt")
f.readline()

In [None]:
f.readline()

In [None]:
f.close()

¡IMPORTANTE!
No reeinventeis la rueda. Si vais a leer un tipo de archivo estructurado para el que ya existen funciones programadas en Python para leerlo, usar estas funciones y no os compliquéis la cabeza.

Algunas librerías para trabajar con diferentes tipos de archivos:
* wave (audio)
* aifc (audio)
* tarfile
* zipfile
* xml.etree.ElementTree
* PyPDF2
* xlwings (Excel)
* Pillow (imágenes)

# Módulo `pickle`

Pickle se utiliza para serializar y des-serializar las estructuras de los objetos de Python. 

Pickle es muy útil para cuando se trabaja con algoritmos de aprendizaje automático, en los que se requiere guardar los modelos para poder hacer nuevas predicciones más adelante, sin tener que reescribir todo o entrenar el modelo de nuevo.

In [None]:
import pickle

In [None]:
def preprocesamiento(x):
    return x/10

In [None]:
def classificador(x):
    if x < 0:
        return 0
    else:
        return 1

In [None]:
modelo = { 'preprocess': preprocesamiento, 'model': classificador, 'accuracy': 0.9}

In [None]:
modelo['preprocess'](20)

In [None]:
filename = 'modelo.pickle'
outfile = open(filename,'wb')
pickle.dump(modelo, outfile)
outfile.close()

In [None]:
infile = open(filename,'rb')
new_dict = pickle.load(infile)
infile.close()

In [None]:
new_dict['model'](-2)

# `try\except`

En Python podemos controlar los errores que sabemos de antemano que pueden ocurrir en nuestros programas. Podeís encontrar una lista de errores definidos en Python [aquí](https://docs.python.org/es/3.7/library/exceptions.html#bltin-exceptions).

In [None]:
2/0

In [None]:
2 + "a"

In [None]:
while True:
    try:
        n = int(input("Elige un número entero: "))
        print(f"Tu número entero es : {n}")
        break
    except ValueError:
        print("Vuelve a intentarlo...")
    except KeyboardInterrupt:
        print("Saliendo...")
        break

Podemos definir nuestros propios errores.

In [None]:
class Error(Exception):
    """Base class for other exceptions"""
    pass


class ValueTooSmallError(Error):
    """Raised when the input value is too small"""
    pass


class ValueTooLargeError(Error):
    """Raised when the input value is too large"""
    pass

`raise` se utiliza para devolver errores

In [None]:
# numero que quermos predecir
number = 10

# el usuario dice un numero y le decimos si el nuestro es mayor o menor para que lo intente adivinar
while True:
    try:
        i_num = int(input("Enter a number: "))
        if i_num < number:
            raise ValueTooSmallError
        elif i_num > number:
            raise ValueTooLargeError
        break
    except ValueTooSmallError:
        print("This value is too small, try again!")
        print()
    except ValueTooLargeError:
        print("This value is too large, try again!")
        print()

print("Congratulations! You guessed it correctly.")

`else` y `finally`:

In [None]:
x = 1

try:
    10/x
except ZeroDivisionError:
    print("Has dividido por cero")
except:
    print("El error ha sido otro")
else:
    print("No ha habido error de dvidir entre 0")
finally:
    print("Lo has intentado")

# Buenas prácticas con Python

El Zen de Python (PEP 20) es una colección de 20 () principios de software que influyen en el diseño del Lenguaje de Programación Python:

In [None]:
import this

En [este enlace](https://pybaq.co/blog/el-zen-de-python-explicado/) podeis encontrar explicado cada principio.

El [PEP 8](https://www.python.org/dev/peps/pep-0008/) proporciona la guía de estilo para código de Python.

### Algunas curiosidades y funcionalidades útiles:

* Enumerate:

In [None]:
z = [ 'a', 'b', 'c', 'd' ]

i = 0
while i < len(z):
    print(i, z[i])
    i += 1

In [None]:
for i in range(0, len(z)):
    print(i, z[i])

In [None]:
for i, item in enumerate(z):
    print(i, item)

In [None]:
?enumerate

In [None]:
list(enumerate(z))

* zip

In [None]:
z_inv = ['z', 'y', 'x', 'w']
z_inv

In [None]:
for i, item in zip(z, z_inv):
    print(i, item)

In [None]:
?zip

In [None]:
list(zip(z, z_inv))

* itertools: Esto ya es un módulo propio con diferentes métodos.

In [None]:
import itertools

In [None]:
dir(itertools)

In [None]:
abc = ['a', 'b', 'c', 'd', 'e']
num = [1, 2, 3, 4]

In [None]:
list(itertools.accumulate(num))

In [None]:
list(itertools.combinations(abc, 3))

In [None]:
list(itertools.permutations(num))

In [None]:
list(itertools.product(num, abc))

* List comprehension:

In [None]:
z = [ i**2 for i in range(0, 5) ]
z

In [None]:
z = [ i**2 for i in range(0, 10) if i % 2 == 0 ]
z

* Dict comprehension:

In [None]:
d = {'a': 1, 'b': 2, 'c': 3}
d

In [None]:
{valor:llave for llave, valor in d.items()}

* La barra baja `_`: Si no vamos a utilizar una variable, se pone la barra baja para no gastar memoria

In [None]:
a, b = (1, 2)
print(a)

In [None]:
a, _ = (1, 2)
print(a)

Y cuando no sabemos cuantas variables va a tener el objeto que nos van a devolver usamos `*`:

In [None]:
a, b = (1, 2, 3, 4, 5)

In [None]:
a, b, *c = (1, 2, 3, 4, 5)
print(a)
print(b)
print(c)

In [None]:
a, b, *_ = (1, 2, 3, 4, 5)
print(a)
print(b)

In [None]:
a, b, *c, d = (1, 2, 3, 4, 5)
print(a)
print(b)
print(c)
print(d)

Estos conceptos son parecidos a los de `*args` y `**kwargs` de como argumentos de funciones en Python.

### `lambda`, `map` y `filter`

`lambda` se usa para crear funciones pequeñas sin nombre, para usar en la ejecución del programa. Se suele utilizar en conjunto con `map` y `filter`.

In [None]:
suma = lambda x, y: x + y

In [None]:
suma(3, 4)

In [None]:
?map

In [None]:
for i in  map(lambda x: x**2, [1, 2, 3]):
    print(i)

In [None]:
for i in map(lambda x,y: x + y, [1, 2, 3], [4, 5, 6]):
    print(i)

In [None]:
m = map(lambda x: x**2, [1,2,3])

In [None]:
m[1]

In [None]:
for i in m:
    print(i)
    break

In [None]:
list(m)

In [None]:
list(m)

In [None]:
?filter

In [None]:
for i in filter(lambda x: x%2 == 0, [1,2,3,4,5,6,7,8,9]):
    print(i)

## Referencias
 - Iker y Mikel (UPV/EHU) lasaiker@fastmail.com, mikelbarrene@gmail.com