# Paths management Platzi

## Different python paths management systems

### OS

In [1]:
import os

In [16]:
CURRENT_DIR = os.getcwd() # Retrieve current directory

print(type(CURRENT_DIR))

print(os.path.abspath(os.path.join(CURRENT_DIR, os.pardir))) # parent directory...
DATA_DIR = os.path.join(CURRENT_DIR, os.pardir, "data/") # os.pardir: ..

print(DATA_DIR)
# Saber si el directorio existe:
print(os.path.exists(DATA_DIR))
# Saber si es directorio:
print(os.path.isdir(DATA_DIR))


<class 'str'>
d:\PROYECTOS\manejo_de_rutas
d:\PROYECTOS\manejo_de_rutas\notebooks\..\data/
True
True


In [17]:
[os.path.join(DATA_DIR, item) for item in os.listdir(DATA_DIR)]

['d:\\PROYECTOS\\manejo_de_rutas\\notebooks\\..\\data/processed',
 'd:\\PROYECTOS\\manejo_de_rutas\\notebooks\\..\\data/raw']

In [14]:
#Comando para crear capeta desde comandos:
os.mkdir(os.path.join(DATA_DIR, "os"))

In [18]:
os.makedirs(os.path.join(DATA_DIR, "external_os", "os", "nested"))

### Pathlib

In [19]:
import pathlib

In [21]:
# Current directory:
CURRENT_DIR = pathlib.Path(".").resolve()
print(type(CURRENT_DIR))

DATA_DIR = CURRENT_DIR.parent.joinpath("data", "raw") # CURRENT_DIR.parent / "data"
print(DATA_DIR)
print(DATA_DIR.exists())
print(DATA_DIR.is_dir())

<class 'pathlib.WindowsPath'>
D:\PROYECTOS\manejo_de_rutas\data\raw
True
True


In [23]:
DATA_DIR.joinpath("external_pathlib", "pathlib", "nested").mkdir(parents=True, exist_ok=True)

In [25]:
list(DATA_DIR.glob("*"))

[WindowsPath('D:/PROYECTOS/manejo_de_rutas/data/raw/.gitkeep'),
 WindowsPath('D:/PROYECTOS/manejo_de_rutas/data/raw/external_pathlib'),
 WindowsPath('D:/PROYECTOS/manejo_de_rutas/data/raw/os')]

In [26]:
list(DATA_DIR.glob(".git*"))

[WindowsPath('D:/PROYECTOS/manejo_de_rutas/data/raw/.gitkeep')]

### PyFilesystem2 - fs

In [30]:
import fs

In [34]:
DATA_DIR=fs.open_fs("../data/raw/")
DATA_DIR.listdir(".")

['.gitkeep', 'external_pathlib', 'os']

In [35]:
DATA_DIR = fs.open_fs("../data")
print(DATA_DIR.exists(""))

for path in DATA_DIR.walk.files(): # walk.dirs
    print(path)

    with DATA_DIR.open(path) as data_files:
        print(data_files.readline())

True
/processed/.gitkeep

/raw/.gitkeep



In [37]:
#Crear nueva carpeta 
DATA_DIR.makedir("external_fs", recreate=True)

SubFS(OSFS('d:\\PROYECTOS\\manejo_de_rutas\\data'), '/external_fs')

In [38]:
sub_data_dir = DATA_DIR.makedirs("external_fs/fs/nested", recreate=True)

In [39]:
sub_data_dir.makedir("test")

SubFS(OSFS('d:\\PROYECTOS\\manejo_de_rutas\\data'), '/external_fs/fs/nested/test')

## Adding root to the project

Ventajas :
Si se mueve el notebook las rutas no se ven afectadas

In [40]:
import pyprojroot

In [42]:
pyprojroot.here("data").joinpath("raw")

WindowsPath('d:/PROYECTOS/manejo_de_rutas/data/raw')

In [43]:
import pyhere

In [44]:
pyhere.here("data", "raw")

WindowsPath('d:/PROYECTOS/manejo_de_rutas/notebooks/../data/raw')

In [45]:
pyhere.here().resolve() / "data" / "raw"

WindowsPath('D:/PROYECTOS/manejo_de_rutas/data/raw')

## Create custom shortcuts

In [47]:
# Nested function.
def make_dir_function(dir_name):
    #*args significa que recibe sin limite de argumentos
    def dir_function(*args):

        if isinstance(dir_name, str):
            return pyprojroot.here().joinpath(dir_name, *args)
        else:
            return pyprojroot.here().joinpath(*dir_name, *args)

    return dir_function

# Nested lambda.
make_dir_function_lambda = lambda dir_name: lambda *args: pyprojroot.here().joinpath(dir_name, *args)

In [48]:
data_dir = make_dir_function("data")
data_dir("external", "os", "do")

WindowsPath('d:/PROYECTOS/manejo_de_rutas/data/external/os/do')

In [49]:
figures_dir = make_dir_function_lambda("figures")
figures_dir("amazing", "plots", "here")

WindowsPath('d:/PROYECTOS/manejo_de_rutas/figures/amazing/plots/here')