## librería os: Llamadas al sistema operativo


El módulo __`os`__ da acceso a llamadas del sistema operativo sobre el que se
está ejecutando el intérprete de Python.

A nivel de diseño, las llamadas
que funcionana en todos los sistemas usan y devuelven la misma interfaz,
independiente del S.O. Por ejemplo, la función stat siempre devuelve
información sobre un fichero con el mismo formato, independientemente de
la plataforma aunque, obviamente, las llamadas realizadas al sistema
operativo sean diferentes.

Las funciones que solo están disponibles para un determinado sistema
operativo estan en submódulos aparte.

El submodulo `os.path` (cargado automáticamente) incluye funciones de
ayuda para trabajar con rutas de archivos.

Algunas de las funciones y atributos de este módulo son:

-   `os.name` : El nombre del sistema operativo sobre el que se está
    ejecutando Python. Algunos valores posibles son posix, nt y java. Si
    se desea más información de este tipo, véase también `sys.platform`
    y `os.uname`

Ejercicio: Importar `os` y imprimimos `os.name`

In [1]:
import os
print(os.name)

posix


-   `os.environ` : Un diccionario que contiene las variables de entorno
    definidas en el sistema operativo. Los valores se obtiene la primera
    vez que se importa el módulo, por lo que no reflejaran los cambios
    hechos después.

In [3]:
import os

print(os.environ['PATH'])

/home/jileon/.virtualenvs/eoi/bin:/home/jileon/Descargas/google-cloud-sdk/bin:/home/jileon/bin:/home/jileon/.local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games


-   `os.path.getsize(path)` : Devuelve el tamaño, en bytes, del fichero
    cuya ruta se la pasa como parámetro.

In [7]:
import os

print(os.path.getsize("os.md"))

3623


-   `os.path.getmtime(path)` : Devuelve el tiempo de la ultima
    modificación del archivo. El valor es en tiempo unix: el número de
    segundos desde la medianoche UTC del 1 de enero de 1970. Vease el
    módulo `time`.

In [9]:
os.listdir()

['timeit.rst',
 'pdb.ipynb',
 'urllib.rst',
 'smtplib.rst',
 'files.backup',
 'xml.rst',
 're.rst',
 'hashlib.rst',
 'sys.md',
 'zlib.ipynb',
 'zlib_sol_01.py',
 'img',
 '.ipynb_checkpoints',
 'lorem.txt',
 'difflib.rst',
 'heapq.rst',
 'traceback.rst',
 'os.ipynb',
 'traceback.ipynb',
 'sqlite3.rst',
 'logging.ipynb',
 'base64.ipynb',
 'os.rst',
 'sys.rst',
 'timeit.ipynb',
 'logging.rst',
 'itertools.ipynb',
 'random.rst',
 'zipfile.ipynb',
 'curses.rst',
 'itertools.rst',
 'compression.ipynb',
 'curses',
 'sys.ipynb',
 'argparse.rst',
 'pdb.rst',
 'argparse.ipynb',
 'datetime.rst',
 'http_server.rst',
 'gzip.ipynb',
 'time.rst',
 'csv.rst',
 'base64.rst',
 'os.md',
 'collections.rst']

In [8]:
import os

print(os.path.getmtime("os.md"))

1586875280.1984298


In [20]:
!touch timeit.rst
for filename in os.listdir(): 
    tiempo_mod = os.path.getmtime(filename) 
    print(filename, tiempo_mod)

timeit.rst 1586878898.9174345
pdb.ipynb 1586875089.1803653
urllib.rst 1586875089.1843653
smtplib.rst 1586875089.1803653
files.backup 1586875089.1763654
xml.rst 1586875089.1843653
re.rst 1583360593.6358325
hashlib.rst 1586875089.1763654
sys.md 1586875888.69607
zlib.ipynb 1586687819.041454
zlib_sol_01.py 1586687819.041454
img 1586875089.1803653
.ipynb_checkpoints 1586876074.518131
lorem.txt 1586687819.041454
difflib.rst 1586875089.1763654
heapq.rst 1583360593.6358325
traceback.rst 1586875089.1843653
os.ipynb 1586878846.509903
traceback.ipynb 1586875089.1843653
sqlite3.rst 1584912936.5459216
logging.ipynb 1586875089.1803653
base64.ipynb 1586875089.1763654
os.rst 1583360593.6358325
sys.rst 1586875089.1803653
timeit.ipynb 1586875089.1843653
logging.rst 1586875089.1803653
itertools.ipynb 1586875089.1803653
random.rst 1586875089.1803653
zipfile.ipynb 1586875089.1843653
curses.rst 1584912936.5459216
itertools.rst 1586875089.1803653
compression.ipynb 1586875089.1763654
curses 1584912936.5459216

-   `os.path.splitext(path)`: Devuelve una tupla de dos elementos (root,
    ext). En la primera posición va la ruta completa del fichero, sin
    extensión, y en la segunda va la extension, de forma que `path` ==
    `root + ext`.

-   `os.walk(top, topdown=True, onerror=None, followlinks=False)` :
    Devuelve un iterador que nos permite examinar todo un sistema de
    archivos.
    

Para cada directorio y subdirectorio en la raíz (indicada
    por `top`), incluyendo la propia raíz, el iterador devuelte una
    tupla de tres elementos (normalmente llamados `dirpath`, `dirnames`
    y `filenames`)
    

- `dirpath` es una cadena de texto, la ruta del directorio

- `dirnames` es una lista con los nombres de los
    subdirectorios dentro de `dirpath` (excluyendo los nombres
    especiales . y ..)
    
- `filenames` es una lista de nombres de los ficheros que **no** son un directorio en `dirpath`.

En cualquier momento podemos tener una ruta absoluta a un archivo `f` en
    `filenames` haciendo `os.path.join(top, dirpath, f)`.

In [33]:
!mkdir -p a/b/c/d
for t in os.walk("."):
    dirpath, dirs, files = t
    print(dirpath, dirs, len(files), sep="     ")

.     ['img', '.ipynb_checkpoints', 'a', 'curses']     42
./img     []     5
./.ipynb_checkpoints     []     2
./a     ['b']     0
./a/b     ['c']     0
./a/b/c     ['d']     1
./a/b/c/d     []     0
./curses     []     6


In [36]:
for t in os.walk("."):
    dirpath, _, files = t
    for filename in files:
        full_path = os.path.join(dirpath, filename)
        print(full_path)

./timeit.rst
./pdb.ipynb
./urllib.rst
./smtplib.rst
./files.backup
./xml.rst
./re.rst
./hashlib.rst
./sys.md
./zlib.ipynb
./zlib_sol_01.py
./lorem.txt
./difflib.rst
./heapq.rst
./traceback.rst
./os.ipynb
./traceback.ipynb
./sqlite3.rst
./logging.ipynb
./base64.ipynb
./os.rst
./sys.rst
./timeit.ipynb
./logging.rst
./itertools.ipynb
./random.rst
./zipfile.ipynb
./curses.rst
./itertools.rst
./compression.ipynb
./sys.ipynb
./argparse.rst
./pdb.rst
./argparse.ipynb
./datetime.rst
./http_server.rst
./gzip.ipynb
./time.rst
./csv.rst
./base64.rst
./os.md
./collections.rst
./img/bulb.png
./img/pdb.jpg
./img/premium.svg
./img/emosido.jpg
./img/imagen.b64.txt
./.ipynb_checkpoints/sys-checkpoint.ipynb
./.ipynb_checkpoints/os-checkpoint.ipynb
./a/b/c/hola.txt
./curses/use_of_pads.py
./curses/initialization.py
./curses/add_ch.py
./curses/full_demo.py
./curses/colors.py
./curses/text_input.py


In [37]:
!touch a/b/c/hola.txt
!ls a/b/c

d  hola.txt


**Ejercicio**: Hacer un script que calcule cuanto ocupan todos los ficheros en un 
determinado directorio, incluyendo sus subdirectorios, si los hubiera. Listar
los nombres absolutos, es decir, incluyendo la ruta desde la raíz, y al final
imprimir el espacio total que ocupan en disco.

In [39]:
acc = 0
for t in os.walk("."):
    dirpath, _, files = t
    for filename in files:
        full_path = os.path.join(dirpath, filename)
        size = os.path.getsize(full_path)
        print(full_path, "ocupa", size, "bytes")
        acc = acc + size
print(f"En total, {acc} bytes")

En total, 840386 bytes
