## La librería os: Llamadas al sistema operativo


El módulo __`os`__ da acceso a llamadas del sistema operativo sobre el que se
está ejecutando el intérprete de Python.

A nivel de diseño, las llamadas
que funcionana en todos los sistemas usan y devuelven la misma interfaz,
independiente del S.O. Por ejemplo, la función stat siempre devuelve
información sobre un fichero con el mismo formato, independientemente de
la plataforma aunque, obviamente, las llamadas realizadas al sistema
operativo sean diferentes.

Las funciones que solo están disponibles para un determinado sistema
operativo estan en submódulos aparte.

El submodulo `os.path` (cargado automáticamente) incluye funciones de
ayuda para trabajar con rutas de archivos.

Algunas de las funciones y atributos de este módulo son:

-   `os.name` : El nombre del sistema operativo sobre el que se está
    ejecutando Python. Algunos valores posibles son posix, nt y java. Si
    se desea más información de este tipo, véase también `sys.platform`
    y `os.uname`

Ejercicio: Importar `os` y imprimimos `os.name`

In [1]:
import os
print(os.name)

posix


-   `os.environ` : Un diccionario que contiene las variables de entorno
    definidas en el sistema operativo. Los valores se obtiene la primera
    vez que se importa el módulo, por lo que no reflejaran los cambios
    hechos después.

In [3]:
import os

print(os.environ['PATH'])

/home/jileon/.virtualenvs/eoi/bin:/home/jileon/Descargas/google-cloud-sdk/bin:/home/jileon/bin:/home/jileon/.local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games


-   `os.path.getsize(path)` : Devuelve el tamaño, en bytes, del fichero
    cuya ruta se la pasa como parámetro.

In [1]:
import os

print(os.path.getsize("os.ipynb"))

15184


-   `os.path.getmtime(path)` : Devuelve el tiempo de la ultima
 modificación del archivo. El valor es en tiempo unix: el número de
 segundos desde la medianoche UTC del 1 de enero de 1970. Vease el
 módulo [`time`](time.ipynb).

In [2]:
import os

print(os.path.getmtime("os.ipynb"))

1588085451.5371134


-  `os.path.listdir(path)` : Devuelve una lista con los nombres de las
entradas en el directorio indicado por el parámetro `path`. Si no se
especifica el parámetro se listará el directorio actual. La lista no
viene en ningún orden determinado, y no incluye las entradas especiales
`.` (Directorio actual) ni `..` (Padre del directorio actual).

In [3]:
os.listdir()

['os.rst', 'os.md', 'os.ipynb', '.ipynb_checkpoints']

In [8]:
!touch timeit.rst
for filename in os.listdir(): 
    tiempo_mod = os.path.getmtime(filename) 
    print(filename, tiempo_mod)

time.rst 1586806837.0959044
hashlib.rst 1586807932.02431
argparse.ipynb 1586803719.5171173
traceback.ipynb 1586802915.274425
lorem.txt.gz 1586733063.4949968
curses 1583745150.370969
timeit.ipynb 1586801625.1886237
.DS_Store 1584451638.9042914
datetime.rst 1586813693.5210686
smtplib.rst 1586807747.020284
sys.rst 1586863021.0782957
urllib.rst 1586807570.760519
sys.ipynb 1586900256.8099008
file.txt.gz 1586730612.0464232
xml.rst 1586806955.8499613
pdb.ipynb 1586806220.3642125
compression.ipynb 1586734180.1917906
heapq.rst 1583176433.088301
curses.rst 1583745946.1560829
re.rst 1583176325.3345604
traceback.rst 1586802118.9939473
os.ipynb 1586901211.1460376
base64.ipynb 1586728118.4503722
sqlite3.rst 1583431666.7162724
img 1586804999.1669888
zipfile.ipynb 1586738307.0160286
itertools.rst 1586787417.5973184
argparse.rst 1586779990.9821239
zlib_sol_01.py 1586537193.4545062
zlib.ipynb 1586558220.1601608
http_server.rst 1586807866.1988044
timeit.rst 1586901232.285203
random.rst 1586806851.3102744

-   `os.path.splitext(path)`: Devuelve una tupla de dos elementos (root,
  ext). En la primera posición va la ruta completa del fichero, sin
  extensión, y en la segunda va la extension, de forma que `path` ==
  `root + ext`.

In [11]:
name, ext = os.path.splitext("README.txt")
print(name)
print(ext)

README
.txt


-   `os.walk(top, topdown=True, onerror=None, followlinks=False)` :
    Devuelve un iterador que nos permite examinar todo un sistema de
    archivos.
    

Para cada directorio y subdirectorio en la raíz (indicada
    por `top`), incluyendo la propia raíz, el iterador devuelte una
    tupla de tres elementos (normalmente llamados `dirpath`, `dirnames`
    y `filenames`)
    

- `dirpath` es una cadena de texto, la ruta del directorio

- `dirnames` es una lista con los nombres de los
    subdirectorios dentro de `dirpath` (excluyendo los nombres
    especiales . y ..)
    
- `filenames` es una lista de nombres de los ficheros que **no** son un directorio en `dirpath`.

En cualquier momento podemos tener una ruta absoluta a un archivo `f` en
    `filenames` haciendo `os.path.join(top, dirpath, f)`.

In [33]:
!mkdir -p a/b/c/d
for t in os.walk("."):
    dirpath, dirs, files = t
    print(dirpath, dirs, len(files), sep="     ")

.     ['img', '.ipynb_checkpoints', 'a', 'curses']     42
./img     []     5
./.ipynb_checkpoints     []     2
./a     ['b']     0
./a/b     ['c']     0
./a/b/c     ['d']     1
./a/b/c/d     []     0
./curses     []     6


In [36]:
for t in os.walk("."):
    dirpath, _, files = t
    for filename in files:
        full_path = os.path.join(dirpath, filename)
        print(full_path)

./timeit.rst
./pdb.ipynb
./urllib.rst
./smtplib.rst
./files.backup
./xml.rst
./re.rst
./hashlib.rst
./sys.md
./zlib.ipynb
./zlib_sol_01.py
./lorem.txt
./difflib.rst
./heapq.rst
./traceback.rst
./os.ipynb
./traceback.ipynb
./sqlite3.rst
./logging.ipynb
./base64.ipynb
./os.rst
./sys.rst
./timeit.ipynb
./logging.rst
./itertools.ipynb
./random.rst
./zipfile.ipynb
./curses.rst
./itertools.rst
./compression.ipynb
./sys.ipynb
./argparse.rst
./pdb.rst
./argparse.ipynb
./datetime.rst
./http_server.rst
./gzip.ipynb
./time.rst
./csv.rst
./base64.rst
./os.md
./collections.rst
./img/bulb.png
./img/pdb.jpg
./img/premium.svg
./img/emosido.jpg
./img/imagen.b64.txt
./.ipynb_checkpoints/sys-checkpoint.ipynb
./.ipynb_checkpoints/os-checkpoint.ipynb
./a/b/c/hola.txt
./curses/use_of_pads.py
./curses/initialization.py
./curses/add_ch.py
./curses/full_demo.py
./curses/colors.py
./curses/text_input.py


In [37]:
!touch a/b/c/hola.txt
!ls a/b/c

d  hola.txt


**Ejercicio**: Hacer un script que calcule cuanto ocupan todos los ficheros en un 
determinado directorio, incluyendo sus subdirectorios, si los hubiera. Listar
los nombres absolutos, es decir, incluyendo la ruta desde la raíz, y al final
imprimir el espacio total que ocupan en disco.

In [12]:
acc = 0
for t in os.walk("."):
    dirpath, _, files = t
    for filename in files:
        full_path = os.path.join(dirpath, filename)
        size = os.path.getsize(full_path)
        print(full_path, "ocupa", size, "bytes")
        acc = acc + size
print(f"En total, {acc} bytes")

./time.rst ocupa 2150 bytes
./hashlib.rst ocupa 1688 bytes
./argparse.ipynb ocupa 24388 bytes
./traceback.ipynb ocupa 7916 bytes
./lorem.txt.gz ocupa 22316 bytes
./timeit.ipynb ocupa 9818 bytes
./.DS_Store ocupa 6148 bytes
./datetime.rst ocupa 2565 bytes
./smtplib.rst ocupa 1838 bytes
./sys.rst ocupa 1298 bytes
./urllib.rst ocupa 2060 bytes
./sys.ipynb ocupa 2695 bytes
./file.txt.gz ocupa 137 bytes
./xml.rst ocupa 3554 bytes
./pdb.ipynb ocupa 6837 bytes
./markdown ocupa 3196 bytes
./compression.ipynb ocupa 1911 bytes
./heapq.rst ocupa 2594 bytes
./curses.rst ocupa 20809 bytes
./re.rst ocupa 4602 bytes
./traceback.rst ocupa 1336 bytes
./os.ipynb ocupa 16073 bytes
./base64.ipynb ocupa 169259 bytes
./sqlite3.rst ocupa 6991 bytes
./time.ipynb ocupa 2859 bytes
./zipfile.ipynb ocupa 14131 bytes
./itertools.rst ocupa 5896 bytes
./argparse.rst ocupa 11637 bytes
./zlib_sol_01.py ocupa 0 bytes
./zlib.ipynb ocupa 14731 bytes
./http_server.rst ocupa 1310 bytes
./timeit.rst ocupa 3496 bytes
./rando