### Módulo **os** para el manejo del sistema de archivos del sistema operativo

Importamos el módulo **os** de Python

In [3]:
import os

Importamos el módulo ***sys*** de Python

In [3]:
import sys

Indicamos la ruta en donde buscar los módulos de la aplicación

In [4]:
sys.path.append('../')

### Principales funciones y propiedades del módulo **os**

La propiedad os.**name** muestra el tipo de sistema operativo

In [5]:
os.name

'nt'

#### Funciones para trabajar con directorios

La función os.**mkdir**, crea un directorio y lanza una excepción si ya existe el directorio.

In [34]:
os.mkdir('nuevo_dir')

FileExistsError: [WinError 183] No se puede crear un archivo que ya existe: 'nuevo_dir'

Ejemplo de una función que crea un directorio.

In [35]:
def dir(directorio):
    try:
        os.mkdir(directorio)
    except FileExistsError as fee:
        print('El directorio ya existe')

dir('nuevo_dir/uno/dos')

La función os.**makedirs**, crea directorios y lanza una excepción si ya existen los directorios.

In [37]:
os.makedirs('nuevo_dir/uno/dos')

FileExistsError: [WinError 183] No se puede crear un archivo que ya existe: 'nuevo_dir/uno/dos'

Ejemplo de una función que crea directorios.

In [38]:
def dirs(directorios):
    try:
        os.makedirs(directorios)
    except FileExistsError as fee:
        print('El directorio ya existe')

dirs('nuevo_dir/uno/dos')

Si cuando utilizamos la función os.**makedirs** indicamos su parámetro *exist_ok* igual a **True**, no se lanzará ninguna excepción, independientemente de que ya existan los directorios.

In [39]:
os.makedirs('nuevo_dir/uno/dos', exist_ok=True)

La función os.**chdir**, cambia de un directorio a otro directorio, lanza una excepción si no encuentra el directorio.

In [40]:
os.chdir('/dis/')

FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado: '/dis/'

Ejemplo de una función que cambia de directorio.

In [None]:
def cd(directorio):
    try:
        os.chdir(directorio)
    except FileNotFoundError as fnfe:
        print('El directorio no existe')

cd('../../')

La función os.**rmdir**, elimina un directorio, lanza una excepción si el directorio no existe o el directorio no está vacío.

In [41]:
os.rmdir('nuevo_dir/uno/dos')

Ejemplo de una función que elimina un directorio.

In [42]:
def rm(directorio):
    try:
        os.rmdir(directorio)
    except FileNotFoundError as fnfe:
        print('El directorio no existe')
    except OSError as oe:
        print('El directorio no está vacío')

rm('nuevo_dir/uno/dos')

El directorio no existe


La función os.**removedirs**, elimina directorios, lanza una excepción si los directorios no existen o están vacíos.

In [44]:
os.removedirs('nuevo_dir/uno')

Ejemplo de una función que elimina directorios.

In [45]:
def rmdirs(directorios):
    try:
        os.removedirs(directorios)
    except FileNotFoundError as fnfe:
        print('Los directorios no existen')
    except OSError as oe:
        print('Los directorios no están vacíos')

rmdirs('nuevo_dir/uno')

Los directorios no existen


La función os.**getcwd**, muestra la ruta actual del directorio de trabajo.

In [6]:
os.getcwd()

'C:\\Proyectos\\idea\\python\\CursoPythonPueMayo\\curso\\notebooks'

La función os.**system**, ejecuta un comando del sistema operativo.

In [11]:
os.system('mkdir novo')

0

#### Funciones para obtener información sobre los directorios y archivos del sistema.

La función os.**listdir**, devuelve una lista con el contenido (subdirectorios y archivos) de un directorio.

In [14]:
contenido = os.listdir('c:\\datasets')
contenido

['csv',
 'data',
 'databricks',
 'datos',
 'datos_v2.1',
 'dni',
 'excel',
 'general',
 'imagenes',
 'libros',
 'mail',
 'malware',
 'seguridad',
 'sites',
 'tool4mob',
 'tool4mob_v2.1',
 'tool4mov_database_v2.1']

La función os.**scandir**, devuelve las entradas (subdirectorios y archivos) del contenido de un directorio.

In [15]:
directorio = 'c:\\datasets'
try:
    with os.scandir(directorio) as entries:
        for entry in entries:
            print(entry.stat())
except FileNotFoundError as fnfe:
    print('El directorio no existe')

os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1715632862, st_mtime=1695722763, st_ctime=0)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1715632862, st_mtime=1714667856, st_ctime=0)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1716285437, st_mtime=1700559798, st_ctime=0)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1715632862, st_mtime=1714405126, st_ctime=0)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1715632862, st_mtime=1704731595, st_ctime=0)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1715632862, st_mtime=1710436855, st_ctime=0)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1715632862, st_m

La función os.**walk**, obtiene toda la información (subdirectorios y archivos) del directorio y de sus subdirectorios

In [16]:
directorio = 'c:\\datasets'
for (dir, subdir, files) in os.walk(directorio):
    for file in files:
        print(os.path.join(dir, file))

c:\datasets\csv\accidentalidad_2008.csv
c:\datasets\csv\BERT_sentiment_IMDB_Dataset.csv
c:\datasets\csv\empresas.csv
c:\datasets\csv\empresas_seguridad.csv
c:\datasets\csv\housing.csv
c:\datasets\csv\housing.data
c:\datasets\csv\jena_climate_2009_2016.csv
c:\datasets\csv\taxi_flota_diario.csv
c:\datasets\data\apellidos.data
c:\datasets\data\c1.txt
c:\datasets\data\ccaa.data
c:\datasets\data\codes.md
c:\datasets\data\direcciones.data
c:\datasets\data\filesystem.data
c:\datasets\data\filesystem.json
c:\datasets\data\housing.csv
c:\datasets\data\housing.data
c:\datasets\data\housing.data.save
c:\datasets\data\logo.png
c:\datasets\data\municipios.data
c:\datasets\data\nombres.data
c:\datasets\data\nomes.pdf
c:\datasets\data\nomes_catalans.pdf
c:\datasets\data\nomes_catalans.txt
c:\datasets\data\personas.dat
c:\datasets\data\poblaciones.data
c:\datasets\data\poblaciones.json
c:\datasets\data\provincias.csv
c:\datasets\data\provincias.data
c:\datasets\data\usuarios.data
c:\datasets\data\boe\

La función os.path.**join**, devuelve la unión entre el nombre del directorio del archivo y el nombre del archivo.

El siguiente ejemplo muestra el nombre completo del archivo (nombre de directorio y nombre del archivo).

In [5]:
directorio = 'c:\\datasets'
try:
    for fichero in os.listdir(directorio):
        nombre_fichero = os.path.join(directorio, fichero)
        print(nombre_fichero)
except FileNotFoundError as fnfe:
    print('El directorio no existe')

c:\datasets\csv
c:\datasets\data
c:\datasets\databricks
c:\datasets\datos
c:\datasets\datos_v2.1
c:\datasets\dni
c:\datasets\excel
c:\datasets\general
c:\datasets\imagenes
c:\datasets\libros
c:\datasets\mail
c:\datasets\malware
c:\datasets\seguridad
c:\datasets\sites
c:\datasets\tool4mob
c:\datasets\tool4mob_v2.1
c:\datasets\tool4mov_database_v2.1


La función os.**remove**, elimina un archivo.

El siguiente ejemplo elimina los archivos de un directorio.

In [None]:
directorio = 'c:\\temp'
for file in os.listdir(directorio):
    os.remove(os.path.join(directorio, file))

La función os.path.**dirname**, devuelve la ruta completa del directorio al cual pertenece el archivo.

In [7]:
file = 'c:\\datasets\\probas\\probas.data'
os.path.dirname(file)

'c:\\datasets\\probas'

La función os.path.**basename**, devuelve el nombre del archivo.

In [8]:
file = 'c:\\datasets\\probas\\probas.data'
os.path.basename(file)

'probas.data'

La función os.path.**abspath**, devuelve el nombre completo del archico formado por el nombre del directorio y el nombre del archivo.

In [None]:
file = 'c:\\datasets\\data\\ccaa.data'
os.path.abspath(file)

La función os.path.**split**, devuelve una tupla formada por el nombre del directorio y el nombre del archivo respectivamente.

In [10]:
file = 'c:\\datasets\\probas\\probas.data'
path, namefile = os.path.split(file)
print(path)
print(namefile)

c:\datasets\probas
probas.data


La función os.path.**isfile**, devuelve verdadero si es un archivo.

In [12]:
file = 'c:\\datasets\\data\\ccaa.data'
if os.path.isfile(file):
    print('Es un archivo')

Es un archivo


La función os.path.**isdir**, devuelve verdadero si es un directorio.

In [13]:
dir = 'c:\\datasets\\data'
if os.path.isdir(dir):
    print('Es un directorio')

Es un directorio


La función os.path.**islink**, devuelve verdadero si es un acceso directo o enlace simbólico.

In [14]:
dir = 'c:\\datasets\\data'
if os.path.islink(dir):
    print('Es un acceso directo')

La función os.path.**exists**, devuelve verdadero si un archivo o directorio existe.

In [16]:
dir = 'c:\\datasets\\data'
if os.path.exists(dir):
    print('El directorio ya existe')

El directorio ya existe


La función os.path.**getsize**, devuelve el tamaño en bytes de un archivo.

In [18]:
file = 'c:\\datasets\\data\\ccaa.data'
bytes = os.path.getsize(file)
print(f'{file} ocupa {bytes} bytes')

c:\datasets\data\ccaa.data ocupa 668 bytes


Importamos el módulo **datetime** de Python, para trabajar con fechas

In [1]:
import datetime as dt

La función os.path.**getctime**, devuelve la fecha y hora en que se creó el archivo o directorio expresado en segundos.

In [4]:
file = 'c:\\datasets\\data\\ccaa.data'
segundos = os.path.getctime(file)
fecha = dt.datetime.fromtimestamp(segundos)
print(fecha)

2023-06-24 22:00:17.558382


La función os.path.**getatime**, devuelve la fecha y hora a la que se accedió por última vez al archivo o directorio expresado en segundos.

In [23]:
file = 'c:\\datasets\\data\\ccaa.data'
segundos = os.path.getatime(file)
fecha = dt.datetime.fromtimestamp(segundos)
print(fecha)

2024-04-18 17:29:21.961353


La función os.path.**getmtime**, devuelve la fecha y hora en que se modificó por última vez el archivo o directorio.

In [24]:
file = 'c:\\datasets\\data\\ccaa.data'
segundos = os.path.getmtime(file)
fecha = dt.datetime.fromtimestamp(segundos)
print(fecha)

2022-04-16 02:32:22


La función os.**stat**, devuelve información sobre el archivo o directorio.

In [25]:
file = 'c:\\datasets\\data\\ccaa.data'
state = os.stat(file)
state

os.stat_result(st_mode=33206, st_ino=18014398510751100, st_dev=4345457957885620246, st_nlink=1, st_uid=0, st_gid=0, st_size=668, st_atime=1713454161, st_mtime=1650069142, st_ctime=1687636817)

In [29]:
path, name = os.path.split(file)
namefile = os.path.abspath(file)
size = state.st_size
date_access = dt.datetime.fromtimestamp(state.st_atime)
date_last = dt.datetime.fromtimestamp(state.st_mtime)
date_create = dt.datetime.fromtimestamp(state.st_ctime)
print(f'File => {namefile}')
print(f'Path => {path}')
print(f'Name => {name}')
print(f'Size => {size}')
print(f'date access => {date_access}')
print(f'date last => {date_last}')
print(f'date create => {date_create}')

File => c:\datasets\data\ccaa.data
Path => c:\datasets\data
Name => ccaa.data
Size => 668
date access => 2024-04-18 17:29:21.961353
date last => 2022-04-16 02:32:22
date create => 2023-06-24 22:00:17.558382
