# Manipulación de ficheros 

## Lectura y escritura de ficheros

In [9]:
import os

# El primer método es con OPEN

# Abrimos el fichero test_file.txt para escritura
out = open('folder_ficheros/test_file.txt', 'w')

# Escribimos la palabra TheBridge en este fichero
out.write("TheBridge 2 \n")

# Cerramos y forzamos el cierre de la conexión
out.close()

# Intentamos escribir más líneas con la conexión cerrada y observamos el resultado
try:
    out.write("otro testo alternativo")
except ValueError as e:
    print(e)

In [4]:
# El segundo método es con el WITH OPEN
ruta_fichero = 'folder_ficheros/otro_test_file.txt'
with open(ruta_fichero, 'w') as f:
    f.write("otro testo")

try:
    f.write("otro testo alternativo")
except ValueError as e:
    print(e)

I/O operation on closed file.


## Rutas o Path

* `r` : read
* `w` : write
* `x` : creación exclusiva
* `a` : append
* `b` : escribe en formato binario
* `t` : modo texto, default
* `+` : modo actualización (tanto a lectura `r+` que a escritura `w+`)

In [12]:
file_path = 'folder_ficheros/test_file.txt'

try:
    with open(file_path, 'r') as inp:
        pass
except FileNotFoundError as e:
    print(e)

In [15]:
# Intentamos abrir el mismo fichero y escribimos dos sentencias
with open(file_path, 'w') as out:
    out.write("Este fichero no existe\n") # Utilizamos \n como nueva linea (newline)
    out.write("YA contiene dos sentencias\n")

In [16]:
# Abrimos el fichero para leer las dos sentencias
try:
    with open(file_path, 'r') as inp:
        content = inp.read()
        print(content)

except FileNotFoundError as e:
    print(e)

Este fichero no existe
YA contiene dos sentencias



In [22]:
content

'Este fichero no existe\nYA contiene dos sentencias\n'

### Lectura de ficheros grandes

In [23]:
from sys import getsizeof

path_big_file = 'folder_ficheros/somehow_big_file.txt'

with open(path_big_file, 'r') as f:
    content = f.read()
    size_in_bytes = getsizeof(content)

    print("El tamaño del fichero es {} en Kb".format(size_in_bytes / 1024))

El tamaño del fichero es 250.087890625 en Kb


In [24]:
# Si queremos leer el fichero línea por línea
with open(path_big_file, 'r') as f:
    counter = 0
    for line in f:
        size_in_bytes = getsizeof(line)
        print("El tamaño de la línea es {} Kb".format(
            size_in_bytes / 1024)
        )
        counter += 1
        if counter == 5:
            break

El tamaño de la línea es 0.291015625 Kb
El tamaño de la línea es 0.1982421875 Kb
El tamaño de la línea es 0.1923828125 Kb
El tamaño de la línea es 0.3056640625 Kb
El tamaño de la línea es 0.240234375 Kb


## Creación de carpetas

`mkdir` o `makedirs`

In [25]:
with open('otra_carpeta/fichero.txt' 'w') as f:
    f.write("Una nueva línea")

FileNotFoundError: [Errno 2] No such file or directory: 'otra_carpeta/fichero.txtw'

In [28]:
# Creamos la carpeta dentro de la actual
new_folder = 'folder_ficheros/otra_carpeta'
os.mkdir(new_folder)

os.mkdir('folder_ficheros/nueva_carpeta')

In [30]:
os.mkdir('folder_ficheros/nueva_carpeta_mas')

FileExistsError: [WinError 183] No se puede crear un archivo que ya existe: 'folder_ficheros/nueva_carpeta_mas'

In [31]:
# creación de carpetas multiples o anidadas
new_folders = 'folder_ficheros/sub1/sub2/sub3'
os.makedirs(new_folders)

## Borrar ficheros y carpetas

In [32]:
# Borramos el fichero test_file.txt
os.remove('folder_ficheros/test_file.txt')

In [33]:
# Borramos una carpeta vacía (siempre se borrará una carpeta vacía no con ficheros)
empty_folder = 'folder_ficheros/nueva_carpeta_mas/'
os.rmdir(empty_folder)

In [34]:
# Intentamos borrar una carpeta con ficheros
try:
    non_empty_fold = 'folder_ficheros'
    os.rmdir(non_empty_fold)
except OSError as e:
    print(e)

[WinError 145] El directorio no está vacío: 'folder_ficheros'


Si queremos utilizar comandos linux podemos operar con el comando en Python
`shutil`

In [43]:
from shutil import rmtree
rmtree

<function shutil.rmtree(path, ignore_errors=False, onerror=None)>

## Rename o renombrar ficheros

In [44]:
# Renombrar fichero original otro_test_file a nuevo_test_modificado
prev_fichero = 'folder_ficheros/otro_test_file.txt'
new_fichero = 'folder_ficheros/nuevo_test_modificado.txt'
os.rename(prev_fichero, new_fichero)

## Funciones auxiliares del comando `path`

In [48]:
# Unimos diferentes partes del un path con el os.join

# En windows
path = "\home"
full_path = os.path.join(path, "Users\\Public\\", "Documents", "")
print(full_path)

\home\Users\Public\Documents\


In [52]:
# Linux y Mac
path = "/home"
full_path = os.path.join(path, "/Users/Public/", "Documents", "")
print(full_path)

/Users/Public/Documents\


In [53]:
# obtener el nombre del directorio
os.path.dirname(full_path)

'/Users/Public/Documents'

In [54]:
# Obtenemos el nombre del fichero
os.path.basename(full_path)

''

In [60]:
# Para separar la extensión del path
nueva_path = '02_DATA_ANALYSIS\01_PYTHON_201\week06\folder_ficheros\nuevo_test_modificado.txt'
os.path.splitext(nueva_path)

('02_DATA_ANALYSIS\x01_PYTHON_201\\week06\x0colder_ficheros\nuevo_test_modificado',
 '.txt')

In [65]:
# Comandos para conocer si es una carpeta o fichero y si existe
e = os.path.exists(nueva_path)
print("Ruta existe? {} \t\t\t".format(nueva_path, e))

path_1 = "./"
e = os.path.exists(path_1)
print("Ruta existe? {}".format(path_1, e))

Ruta existe? 02_DATA_ANALYSIS_PYTHON_201\week06older_ficheros
uevo_test_modificado.txt 			
Ruta existe? ./


In [64]:
os.path.exists(nueva_path)

False

In [68]:
ruta_fichero = 'folder_ficheros/nuevo_test_modificado.txt'
os.path.isfile(ruta_fichero)

True

In [69]:
directorio = 'folder_ficheros'
os.path.isdir(directorio)

True

In [70]:
# Realizamos las entradas de un determinado directorio evaluando si tenemos 
# tanto carpetas que ficheros solo primer nivel
with os.scandir(directorio) as dir_list:
    for entry in dir_list:
        print(entry.name)

nueva_carpeta
nuevo_test_modificado.txt
otra_carpeta
somehow_big_file.txt
sub1


In [71]:
# Mostramos todos los ficheros de la carpeta con una condición isfile
with os.scandir(directorio) as dir_list:
    for entry in dir_list:
        if os.path.isfile(entry.path):
            print(entry.name)

nuevo_test_modificado.txt
somehow_big_file.txt


In [73]:
with os.scandir(directorio) as dir_list:
    for entry in dir_list:
        if entry.is_file() and entry.name.endswith(".txt"):
            print(entry.name)

somehow_big_file.txt


In [77]:
# import glob
import glob
glob.glob('**/*', recursive=True)

['05_manipulacion_ficheros.ipynb',
 'folder_ficheros',
 'folder_ficheros\\nueva_carpeta',
 'folder_ficheros\\nuevo_test_modificado.md',
 'folder_ficheros\\otra_carpeta',
 'folder_ficheros\\somehow_big_file.txt',
 'folder_ficheros\\sub1',
 'folder_ficheros\\sub1\\sub2',
 'folder_ficheros\\sub1\\sub2\\sub3']

In [82]:
os.getcwd()

'c:\\Users\\mrusso\\OneDrive - ATSISTEMAS SA\\Documentos\\GitHub\\TheBridge_DataScience_PT_ALUMNI_sep22\\02_DATA_ANALYSIS\\01_PYTHON_201\\week06'

In [86]:
glob.glob('**/*.txt')

['folder_ficheros\\somehow_big_file.txt']

## Tratamiento de ficheros comprimidos

In [87]:
import zipfile as zf

zip_file = 'carpeta_ficheros.zip'

# Para crear ficheros comprimidos

# with zf.ZipFile(zip_file, 'w', compression=zf.ZIP_DEFLATED) as zip_f:
#     zip_f.write(<fichero_grande o cualquier fichero>)

In [88]:
# Para leer un fichero comprimido
with zf.ZipFile(zip_file, 'r') as zip_f:
    # Mostramos el contenido del fichero
    print(zip_f.printdir())

    # Descomprimimos el contenido del zip
    zip_f.extractall()

File Name                                             Modified             Size
carpeta_ficheros/                              2022-06-09 00:52:38            0
carpeta_ficheros/data_marvel-wikia-data.csv    2022-03-31 20:15:12      2406621
carpeta_ficheros/fichero.py                    2022-03-31 18:38:24           15
carpeta_ficheros/fichero_prueba_2.txt          2022-03-31 19:19:24          500
carpeta_ficheros/new_folder/                   2022-06-09 00:52:52            0
carpeta_ficheros/new_folder/1/                 2022-06-09 00:53:20            0
carpeta_ficheros/new_folder/1/fichero_prueba_2.txt 2022-03-31 19:19:24          500
carpeta_ficheros/new_folder/fichero_prueba_2.txt 2022-03-31 19:19:24          500
carpeta_ficheros/New_York_City.png             2022-04-01 19:02:04       249302
carpeta_ficheros/somehow_big_file.txt          2022-03-31 19:24:24       256041
None


In [90]:
# Descomprimir un solo fichero
with zf.ZipFile(zip_file, 'r') as zip_f:
    # Mostramos el contenido del fichero
    print(zip_f.printdir())

    # Descomprimimos el fichero
    zip_f.extract("carpeta_ficheros/New_York_City.png")

File Name                                             Modified             Size
carpeta_ficheros/                              2022-06-09 00:52:38            0
carpeta_ficheros/data_marvel-wikia-data.csv    2022-03-31 20:15:12      2406621
carpeta_ficheros/fichero.py                    2022-03-31 18:38:24           15
carpeta_ficheros/fichero_prueba_2.txt          2022-03-31 19:19:24          500
carpeta_ficheros/new_folder/                   2022-06-09 00:52:52            0
carpeta_ficheros/new_folder/1/                 2022-06-09 00:53:20            0
carpeta_ficheros/new_folder/1/fichero_prueba_2.txt 2022-03-31 19:19:24          500
carpeta_ficheros/new_folder/fichero_prueba_2.txt 2022-03-31 19:19:24          500
carpeta_ficheros/New_York_City.png             2022-04-01 19:02:04       249302
carpeta_ficheros/somehow_big_file.txt          2022-03-31 19:24:24       256041
None
