**CHAPTER 5 - Files and I/O**

* Todos los programas necesitan realizar entrada y salida. Este capítulo cubre los modismos comunes para trabajar con diferentes tipos de archivos, incluidos archivos de texto y binarios, codificaciones de archivos y otros temas relacionados. También se abordan técnicas para manipular nombres de archivos y directorios.

**Reading and Writing Text Data**

**Problema**
* Necesitas leer o escribir datos de texto, posiblemente en diferentes codificaciones de texto como ASCII, UTF-8 o UTF-16.

* **Solución**
* Utiliza la **función open()** con el modo **'rt'** para leer un archivo de texto. Por ejemplo:

In [57]:
# Abre el archivo en modo lectura de texto ('rt')
with open('./codigo.txt', 'rt') as f:
    # Lee todo el contenido del archivo en una sola cadena
    contenido = f.read()

# 'contenido' ahora contiene todo el contenido del archivo como una sola cadena
print(contenido)

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt


"""
De esta manera podemos llamar a un modulo y sus funciones desde Jupyter Notebook en vscode
"""
%run "../Algebra_lineal_Machine_Learning/Funciones_Auxiliares/GraficarVectores.ipynb"

def Graficar_Vectores(vecs, cols, alpha = 1):
    plt.figure(figsize=(4,4))
    plt.axvline(x= 0, color = "grey",zorder = 0)
    plt.axhline(y= 0, color = "grey",zorder = 0)

    for i in range(len(vecs)):
        x = np.concatenate([[0,0], vecs[i]])
        plt.quiver([x[0]],
                   [x[1]],
                   [x[2]],
                   [x[3]],
                   angles = "xy", scale_units = "xy",
                   scale = 1,
                   color = cols[i],
                   alpha = alpha)


Graficar_Vectores([v1,v2,v1v2],["green","blue","red"])



In [58]:
# Abre el archivo en modo lectura de texto ('rt')
with open('./codigo.txt', 'rt') as f:
    # Itera sobre cada línea del archivo
    for linea in f:
        # Procesa cada línea como desees
        # Ejemplo: imprime la línea eliminando espacios en blanco al inicio y al final
        print(linea.strip())  


%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt


"""
De esta manera podemos llamar a un modulo y sus funciones desde Jupyter Notebook en vscode
"""
%run "../Algebra_lineal_Machine_Learning/Funciones_Auxiliares/GraficarVectores.ipynb"

def Graficar_Vectores(vecs, cols, alpha = 1):
plt.figure(figsize=(4,4))
plt.axvline(x= 0, color = "grey",zorder = 0)
plt.axhline(y= 0, color = "grey",zorder = 0)

for i in range(len(vecs)):
x = np.concatenate([[0,0], vecs[i]])
plt.quiver([x[0]],
[x[1]],
[x[2]],
[x[3]],
angles = "xy", scale_units = "xy",
scale = 1,
color = cols[i],
alpha = alpha)


Graficar_Vectores([v1,v2,v1v2],["green","blue","red"])


* Del mismo modo, para escribir en un archivo de texto en Python, puedes usar la **función open()** con el **modo 'wt'** para escribir un archivo, limpiando y sobrescribiendo el contenido anterior (si lo hay). Aquí tienes un ejemplo:

In [59]:
# Abre el archivo en modo escritura de texto ('wt')
with open('./somefile.txt', 'wt') as f:
    # Escribe contenido en el archivo
    f.write('Hola, mundo!\n')
    f.write('Esta es otra línea.\n')
    f.write('Y una tercera línea.\n')


In [60]:
with open('./somefile.txt','rt') as f:
    contenido = f.read()
    

print(contenido)

Hola, mundo!
Esta es otra línea.
Y una tercera línea.



* Para redirigir las declaraciones de impresión (print statements) a un archivo de texto en Python, puedes utilizar el parámetro file de la función print(). Aquí tienes un ejemplo de cómo hacerlo:

In [61]:
# Abre el archivo en modo escritura de texto ('wt')
with open('somefile.txt', 'wt') as f:
    # Redirige las impresiones al archivo
    print("Línea 1", file=f)
    print("Línea 2", file=f)
   


In [62]:
with open('./somefile.txt','rt') as f:
    contenido = f.read()
    

print(contenido)

Línea 1
Línea 2



**5.5. Escribir en un archivo que no existe aún**

**Problema**
* Quieres escribir datos en un archivo, pero solo si aún no existe en el sistema de archivos.

**Solución**
* Este problema se resuelve fácilmente **utilizando el modo x en lugar del modo w con la función open()**. Por ejemplo:

In [63]:
"""
with open('somefile2','wt') as f:
    f.write('Hello Loky')

with open('somefile2','xt') as f:
    f.write('Hello Loky')

    
 Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
 FileExistsError: [Errno 17] File exists: 'somefile'
"""

'\nwith open(\'somefile2\',\'wt\') as f:\n    f.write(\'Hello Loky\')\n\nwith open(\'somefile2\',\'xt\') as f:\n    f.write(\'Hello Loky\')\n\n    \n Traceback (most recent call last):\n  File "<stdin>", line 1, in <module>\n FileExistsError: [Errno 17] File exists: \'somefile\'\n'

**Discusión**
* Esta receta ilustra una solución extremadamente elegante a un problema que a veces surge al escribir archivos (es decir, sobrescribir accidentalmente un archivo existente). Una solución alternativa es primero verificar la existencia del archivo de esta manera:

In [64]:
import os  # Importa el módulo os para interactuar con el sistema operativo

# Comprueba si el archivo 'somefile2.txt' no existe
if not os.path.exists('somefile2.txt'):
    # Si el archivo no existe, abre el archivo en modo de escritura de texto ('wt')
    with open('somefile2.txt', 'wt') as f:
        # Escribe 'Hello Loky, How are you?' en el archivo
        f.write('Hello Loky, How are you?')
else:
    # Si el archivo ya existe, imprime 'File already exists!!'
    print('File already exists!!')


File already exists!!


**5.12. Probando la existencia de un archivo**

**Problema**
* Necesitas verificar si un archivo o directorio existe.

**Solución**
* Utiliza el módulo os.path para verificar la existencia de un archivo o directorio. Por ejemplo:

In [65]:
import os

print(os.path.exists('somefile.txt'))
print(os.path.exists('somefile4.txt'))

True
False


* Puedes realizar pruebas adicionales para determinar qué tipo de archivo podría ser. Estas pruebas devuelven False si el archivo en cuestión no existe:

In [66]:
#Is a regular file
os.path.isfile('./codigo.txt')

True

In [67]:
#Is a directory
os.path.isdir(r'C:\Users\Mike\Desktop/walmex')

True

* Si necesitas obtener metadatos (como el tamaño del archivo o la fecha de modificación), eso también está disponible en el módulo os.path.

In [68]:
#Tamaño del archivo
print(os.path.getsize('./codigo.txt'))

#Fecha de modificacion
import time
print(time.ctime(os.path.getatime('./codigo.txt')))

856
Wed Jul 17 04:42:49 2024


**5.13. Obteniendo un listado de directorio**

**Problema**
* Quieres obtener una lista de los archivos contenidos en un directorio en el sistema de archivos.

**Solución**
* Utiliza la función **os.listdir()** para obtener una lista de archivos en un directorio:


In [69]:
import os

names = os.listdir(r'C:\Users\Mike\Desktop/Dir')
for dir in names:
    print(dir)

DirInterno
DirInterno2
DirInterno3


Esto te dará el listado bruto del directorio, incluyendo todos 
 * los archivos. 
 * subdirectorios.
 * enlaces simbólicos y demás. 
 
Si necesitas filtrar los datos de alguna manera, considera usar una comprensión de lista combinada con varias funciones del módulo os.path. Por ejemplo:

In [70]:
import os

Directory = os.listdir(r'C:\Users\Mike\Desktop/walmex')
for files in Directory:
    print(files)

Flujos de Efectivo.xlsx
Piramide Ratios ROE - copia.xlsx
Piramide Ratios ROE.xlsx
Walmex Analisis Vertical y Horizontal.xlsx
Walmex Horizontal - Liquidez.xlsx


In [71]:
import os

size = os.path.getsize(r'C:\Users\Mike\Desktop/Data_Engineer')
Directory = os.listdir(r'C:\Users\Mike\Desktop/Data_Engineer')
for files in Directory:
    print(files)

.vscode
Datos-faltantes
Desarrollos Varios
Entornos_Virtuales
Funciones_Python
Musica_python.ipynb
Programacion Orientada Objetos Python
Pruebas
Regresion Logistica
reports
ScriptsShell
Selenium
web-scraping-master
WhatsApp_Python


In [72]:
import os

ruta = r'C:\Users\Mike\Desktop\Data_Engineer'
#names = [name for name in os.listdir(ruta) if os.path.isfile(os.path.join(ruta,name))]

for name in os.listdir(ruta):
    # Construye la ruta completa de cada archivo
    full_path = os.path.join(ruta, name)
    print(full_path)
    # Comprueba si es un archivo regular
    if os.path.isfile(full_path):
        print(f"Archivo: {name}, Tamaño: {os.path.getsize(full_path)} bytes")



C:\Users\Mike\Desktop\Data_Engineer\.vscode
C:\Users\Mike\Desktop\Data_Engineer\Datos-faltantes
C:\Users\Mike\Desktop\Data_Engineer\Desarrollos Varios
C:\Users\Mike\Desktop\Data_Engineer\Entornos_Virtuales
C:\Users\Mike\Desktop\Data_Engineer\Funciones_Python
C:\Users\Mike\Desktop\Data_Engineer\Musica_python.ipynb
Archivo: Musica_python.ipynb, Tamaño: 1844 bytes
C:\Users\Mike\Desktop\Data_Engineer\Programacion Orientada Objetos Python
C:\Users\Mike\Desktop\Data_Engineer\Pruebas
C:\Users\Mike\Desktop\Data_Engineer\Regresion Logistica
C:\Users\Mike\Desktop\Data_Engineer\reports
C:\Users\Mike\Desktop\Data_Engineer\ScriptsShell
C:\Users\Mike\Desktop\Data_Engineer\Selenium
C:\Users\Mike\Desktop\Data_Engineer\web-scraping-master
C:\Users\Mike\Desktop\Data_Engineer\WhatsApp_Python


In [73]:
import os

ruta = r'C:\Users\Mike\Desktop\Data_Engineer'
names = [name for name in os.listdir(ruta) if os.path.isfile(os.path.join(ruta,name))]
print(names)

['Musica_python.ipynb']


In [74]:
for name in os.listdir(ruta):
    if os.path.isdir:
        full_path = os.path.join(ruta,name)

    # print(name)

![image.png](attachment:image.png)

In [75]:
dirnames = [
    name for name in os.listdir(ruta) 
    if os.path.isdir(os.path.join(ruta, name))]


dirnames

['.vscode',
 'Datos-faltantes',
 'Desarrollos Varios',
 'Entornos_Virtuales',
 'Funciones_Python',
 'Programacion Orientada Objetos Python',
 'Pruebas',
 'Regresion Logistica',
 'reports',
 'ScriptsShell',
 'Selenium',
 'web-scraping-master',
 'WhatsApp_Python']

**Los métodos startswith() y endswith()** de las cadenas de texto también pueden ser útiles para filtrar el contenido de un directorio. Por ejemplo:

In [76]:
ruta2 = r'C:\Users\Mike\Desktop\PythonOOP\TkinterClases/PequeñasFuncionalidades'

pyfiles = [
    name for name in os.listdir(ruta2) 
    if name.endswith('.py')
    ]

pyfiles

['App.py',
 'ApplicationFirstBook.py',
 'helloWorld.py',
 'Mv.py',
 'prueba.py',
 'scrollbar_2_max.py',
 'SuperhelloWorld.py',
 'Tabulacion_por_pantalla.py']


Para hacer coincidir nombres de archivo, puede ser más útil utilizar los módulos glob o fnmatch en su lugar. Por ejemplo:




**glob** 

* se utiliza para buscar archivos y directorios utilizando patrones de coincidencia.

**fnmatch**
* se utiliza para realizar coincidencias de nombres de archivo utilizando patrones de caracteres similares a los utilizados en las shells Unix.

In [87]:
from fnmatch import fnmatch

pyfiles = [name for name in os.listdir(ruta2)
           if fnmatch(name,'*.py')]

pyfiles

['App.py',
 'ApplicationFirstBook.py',
 'helloWorld.py',
 'Mv.py',
 'prueba.py',
 'scrollbar_2_max.py',
 'SuperhelloWorld.py',
 'Tabulacion_por_pantalla.py']