## La librería os: Llamadas al sistema operativo


El módulo __`os`__ da acceso a llamadas del sistema operativo sobre el que se
está ejecutando el intérprete de Python.

A nivel de diseño, las llamadas
que funcionana en todos los sistemas usan y devuelven la misma interfaz,
independiente del S.O. Por ejemplo, la función stat siempre devuelve
información sobre un fichero con el mismo formato, independientemente de
la plataforma aunque, obviamente, las llamadas realizadas al sistema
operativo sean diferentes.

Las funciones que solo están disponibles para un determinado sistema
operativo estan en submódulos aparte.

El submodulo `os.path` (cargado automáticamente) incluye funciones de
ayuda para trabajar con rutas de archivos.

Algunas de las funciones y atributos de este módulo son:

-   `os.name` : El nombre del sistema operativo sobre el que se está
    ejecutando Python. Algunos valores posibles son posix, nt y java. Si
    se desea más información de este tipo, véase también `sys.platform`
    y `os.uname`

Ejercicio: Importar `os` y imprimimos `os.name`

In [1]:
import os
print(os.name)

posix


-   `os.environ` : Un diccionario que contiene las variables de entorno
    definidas en el sistema operativo. Los valores se obtiene la primera
    vez que se importa el módulo, por lo que no reflejaran los cambios
    hechos después.

In [5]:
import os

for name in os.environ:
    print(name)

SHELL
SESSION_MANAGER
QT_ACCESSIBILITY
COLORTERM
XDG_CONFIG_DIRS
XDG_SESSION_PATH
GNOME_DESKTOP_SESSION_ID
LANGUAGE
MANDATORY_PATH
LC_ADDRESS
LC_NAME
SSH_AUTH_SOCK
DESKTOP_SESSION
LC_MONETARY
SSH_AGENT_PID
GTK_MODULES
XDG_SEAT
ZEITGEIST_DATA_PATH
PWD
LOGNAME
XDG_SESSION_DESKTOP
QT_QPA_PLATFORMTHEME
XDG_SESSION_TYPE
GPG_AGENT_INFO
XAUTHORITY
XDG_GREETER_DATA_DIR
GDM_LANG
VIRTUALENVWRAPPER_SCRIPT
HOME
IM_CONFIG_PHASE
LC_PAPER
LANG
LS_COLORS
XDG_CURRENT_DESKTOP
VIRTUAL_ENV
VTE_VERSION
VIRTUALENVWRAPPER_WORKON_CD
G_ENABLE_DIAGNOSTIC
XDG_SEAT_PATH
GNOME_TERMINAL_SCREEN
VIRTUALENVWRAPPER_PYTHON
INVOCATION_ID
MANAGERPID
WORKON_HOME
LESSCLOSE
XDG_SESSION_CLASS
TERM
LC_IDENTIFICATION
GTK_OVERLAY_SCROLLING
DEFAULTS_PATH
LESSOPEN
USER
GNOME_TERMINAL_SERVICE
VIRTUALENVWRAPPER_PROJECT_FILENAME
DISPLAY
SHLVL
LC_TELEPHONE
LC_MEASUREMENT
XDG_VTNR
XDG_SESSION_ID
XDG_RUNTIME_DIR
PS1
JOURNAL_STREAM
XDG_DATA_DIRS
PATH
VIRTUALENVWRAPPER_HOOK_DIR
GDMSESSION
DBUS_SESSION_BUS_ADDRESS
LC_NUMERIC
OLDPWD
_
KERNE

In [6]:
print(os.environ['HOME'])

/home/jileon


In [7]:
os.listdir()

['.ipynb_checkpoints', 'os.ipynb', 'os.rst', 'os.md']

-   `os.path.getsize(path)` : Devuelve el tamaño, en bytes, del fichero
    cuya ruta se la pasa como parámetro.

In [11]:
import os
# hola

print(os.path.getsize("os.ipynb"))

21825


In [15]:
for n in os.listdir():
    print(f"El fichero {n} ocupa {os.path.getsize(n)//1024} Kb")

El fichero .ipynb_checkpoints ocupa 4 Kb
El fichero os.ipynb ocupa 21 Kb
El fichero os.rst ocupa 3 Kb
El fichero os.md ocupa 3 Kb


-   `os.path.getmtime(path)` : Devuelve el tiempo de la ultima
 modificación del archivo. El valor es en tiempo unix: el número de
 segundos desde la medianoche UTC del 1 de enero de 1970. Vease el
 módulo [`time`](time.ipynb).

In [22]:
import datetime

for n in os.listdir():
    ts = os.path.getmtime(n)
    dt = datetime.datetime.fromtimestamp(ts)
    print(f"El fichero {n} se modificó en {dt}")

El fichero .ipynb_checkpoints se modificó en 2020-10-19 15:25:56.266829
El fichero os.ipynb se modificó en 2020-10-19 16:58:56.159873
El fichero os.rst se modificó en 2020-03-04 22:23:13.635833
El fichero os.md se modificó en 2020-04-14 15:41:20.198430


In [5]:
import os

print(os.path.getmtime("os.ipynb"))

1586901091.0901787


-  `os.path.listdir(path)` : Devuelve una lista con los nombres de las
entradas en el directorio indicado por el parámetro `path`. Si no se
especifica el parámetro se listará el directorio actual. La lista no
viene en ningún orden determinado, y no incluye las entradas especiales
`.` (Directorio actual) ni `..` (Padre del directorio actual).

In [6]:
os.listdir()

['time.rst',
 'hashlib.rst',
 'argparse.ipynb',
 'traceback.ipynb',
 'lorem.txt.gz',
 'curses',
 'timeit.ipynb',
 '.DS_Store',
 'datetime.rst',
 'smtplib.rst',
 'sys.rst',
 'urllib.rst',
 'sys.ipynb',
 'file.txt.gz',
 'xml.rst',
 'pdb.ipynb',
 'compression.ipynb',
 'heapq.rst',
 'curses.rst',
 're.rst',
 'traceback.rst',
 'os.ipynb',
 'base64.ipynb',
 'sqlite3.rst',
 'img',
 'zipfile.ipynb',
 'itertools.rst',
 'argparse.rst',
 'zlib_sol_01.py',
 'zlib.ipynb',
 'http_server.rst',
 'timeit.rst',
 'random.rst',
 'lorem.txt',
 'files.backup',
 '.ipynb_checkpoints',
 'difflib.rst',
 'csv.rst',
 'logging.rst',
 'base64.rst',
 'pdb.rst',
 'logging.ipynb',
 'os.rst',
 'itertools.ipynb',
 'gzip.ipynb',
 'collections.rst']

In [8]:
!touch timeit.rst
for filename in os.listdir(): 
    tiempo_mod = os.path.getmtime(filename) 
    print(filename, tiempo_mod)

time.rst 1586806837.0959044
hashlib.rst 1586807932.02431
argparse.ipynb 1586803719.5171173
traceback.ipynb 1586802915.274425
lorem.txt.gz 1586733063.4949968
curses 1583745150.370969
timeit.ipynb 1586801625.1886237
.DS_Store 1584451638.9042914
datetime.rst 1586813693.5210686
smtplib.rst 1586807747.020284
sys.rst 1586863021.0782957
urllib.rst 1586807570.760519
sys.ipynb 1586900256.8099008
file.txt.gz 1586730612.0464232
xml.rst 1586806955.8499613
pdb.ipynb 1586806220.3642125
compression.ipynb 1586734180.1917906
heapq.rst 1583176433.088301
curses.rst 1583745946.1560829
re.rst 1583176325.3345604
traceback.rst 1586802118.9939473
os.ipynb 1586901211.1460376
base64.ipynb 1586728118.4503722
sqlite3.rst 1583431666.7162724
img 1586804999.1669888
zipfile.ipynb 1586738307.0160286
itertools.rst 1586787417.5973184
argparse.rst 1586779990.9821239
zlib_sol_01.py 1586537193.4545062
zlib.ipynb 1586558220.1601608
http_server.rst 1586807866.1988044
timeit.rst 1586901232.285203
random.rst 1586806851.3102744

-   `os.path.splitext(path)`: Devuelve una tupla de dos elementos (root,
  ext). En la primera posición va la ruta completa del fichero, sin
  extensión, y en la segunda va la extension, de forma que `path` ==
  `root + ext`.

In [11]:
name, ext = os.path.splitext("README.txt")
print(name)
print(ext)

README
.txt


In [41]:
!tree

[01;34m.[00m
├── [01;34marchivo[00m
│   ├── [01;34m2018[00m
│   │   ├── [01;34mdic[00m
│   │   └── [01;34mnov[00m
│   │       └── fac01.txt
│   ├── [01;34m2019[00m
│   │   ├── [01;34mdec[00m
│   │   ├── [01;34mene[00m
│   │   ├── [01;34mfeb[00m
│   │   │   └── fac22.txt
│   │   └── [01;34mnov[00m
│   └── [01;34m2020[00m
│       └── [01;34mene[00m
│           └── fac23.txt
├── os.ipynb
├── os.md
└── os.rst

11 directories, 6 files


In [33]:
os.listdir('archivo')

['2018', '2019', '2020']

### os.path.walk

-   `os.walk(top, topdown=True, onerror=None, followlinks=False)` :
    Devuelve un iterador que nos permite examinar todo un sistema de
    archivos.
    

Para cada directorio y subdirectorio en la raíz (indicada
    por `top`), incluyendo la propia raíz, el iterador devuelte una
    tupla de tres elementos (normalmente llamados `dirpath`, `dirnames`
    y `filenames`)
    

- `dirpath` es una cadena de texto, la ruta del directorio

- `dirnames` es una lista con los nombres de los
    subdirectorios dentro de `dirpath` (excluyendo los nombres
    especiales . y ..)
    
- `filenames` es una lista de nombres de los ficheros que **no** son un directorio en `dirpath`.

En cualquier momento podemos tener una ruta absoluta a un archivo `f` en
    `filenames` haciendo `os.path.join(top, dirpath, f)`.

In [47]:
for dirpath, dirs, files in os.walk("/home/jileon"):
    for f in files:
        if f.endswith('.txt'):
            print(f"Fichero {f} en {dirpath}")
    

Fichero chunk.txt en /home/jileon
Fichero imagen.b64.txt en /home/jileon
Fichero humans.txt en /home/jileon/wwwroot
Fichero test_simple_pages.txt en /home/jileon/wwwroot
Fichero robots.txt en /home/jileon/wwwroot
Fichero requirements.txt en /home/jileon/wwwroot
Fichero todo.txt en /home/jileon/wwwroot/suscripcion
Fichero presiden_vil.txt en /home/jileon/wwwroot/composicion
Fichero grupos_viil.txt en /home/jileon/wwwroot/composicion
Fichero comisiones_vl.txt en /home/jileon/wwwroot/composicion
Fichero presiden_vl.txt en /home/jileon/wwwroot/composicion
Fichero grupos_vl.txt en /home/jileon/wwwroot/composicion
Fichero grupos_ivl.txt en /home/jileon/wwwroot/composicion
Fichero comisiones_ivl.txt en /home/jileon/wwwroot/composicion
Fichero presiden_ivl.txt en /home/jileon/wwwroot/composicion
Fichero grupos_vil.txt en /home/jileon/wwwroot/composicion
Fichero comisiones_vil.txt en /home/jileon/wwwroot/composicion
Fichero last-message.txt en /home/jileon/wwwroot/.hg
Fichero jornadas.txt en /h

In [48]:
for t in os.walk("archivo"):
    dirpath, _, files = t
    for filename in files:
        full_path = os.path.join(dirpath, filename)
        print(full_path)

archivo/2018/nov/fac01.txt
archivo/2019/feb/fac22.txt
archivo/2020/ene/fac23.txt


In [37]:
!touch a/b/c/hola.txt
!ls a/b/c

d  hola.txt


**Ejercicio**: Hacer un script que calcule cuanto ocupan todos los ficheros en un 
determinado directorio, incluyendo sus subdirectorios, si los hubiera. Listar
los nombres absolutos, es decir, incluyendo la ruta desde la raíz, y al final
imprimir el espacio total que ocupan en disco.

In [51]:
acc = 0
for t in os.walk("archivo"):
    dirpath, _, files = t
    for filename in files:
        full_path = os.path.join(dirpath, filename)
        size = os.path.getsize(full_path)
        print(full_path, "ocupa", size, "bytes")
        acc = acc + size
print(f"En total, {acc} bytes")

archivo/2018/nov/fac01.txt ocupa 0 bytes
archivo/2019/feb/fac22.txt ocupa 12 bytes
archivo/2020/ene/fac23.txt ocupa 0 bytes
En total, 12 bytes


In [50]:
!echo "hola, mundo" > ./archivo/2019/feb/fac22.txt