# Trabajar con archivos

Para trabajar con archivos en Python, primero debes abrir el archivo en modo lectura o escritura. Puedes hacerlo usando la función open() de Python.

A continuación se muestra un ejemplo de cómo abrir un archivo para leer su contenido:

In [7]:
with open('employee-data.json', 'r') as f:
    contenido = f.read(280)
    print(contenido)

{
  "Employees": [
    {
      "userId": "krish",
      "jobTitle": "Developer",
      "firstName": "Krish",
      "lastName": "Lee",
      "employeeCode": "E1",
      "region": "CA",
      "phoneNumber": "788456123",
      "emailAddress": "krish.lee@examplepython.com"
    },
   


Para escribir en un archivo, puedes usar el modo escritura ('w'). Por ejemplo:

In [19]:
with open('archivo.txt', 'w') as f:
    f.write('Hola, mundo!')

Para navegar entre los archivos de nuestra carpeta haremos uso de la librería "os" que usaremos como interfaz entre el sistema operativo y Python

In [20]:
import os

# Listar los archivos en el directorio actual
archivos = os.listdir('.')
print(archivos)

['.git', 'archivo.txt', 'control_structures.ipynb', 'employee-data.json', 'files.ipynb', 'functions.ipynb', 'introduction.ipynb', 'oop.ipynb', 'README.md']


Para renombrar un archivo:

In [21]:
import os

os.rename("archivo.txt","newArchivo.txt")

O por ejemplo, para borrar un archivo:

In [23]:
import os

# Eliminar el archivo 'archivo.txt'
os.remove('newarchivo.txt')

### Excepciones
Es importante saber que el manejo de estas funciones debe ser controlado metódicamente ya que, por ejemplo, si intentamos borrar un archivo que no existe nos lanzará una excepción:

In [24]:
import os

# Eliminar el archivo 'archivo.txt'
os.remove('newarchivo.txt')

FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado: 'newarchivo.txt'

Para controlar ésta excepción podemos utilizar los bloques try-except:

In [34]:
import os

try:

    # Eliminar el archivo 'archivo.txt'
    os.remove('archivo.txt')

except Exception as e:
    print("Mensaje de error:", e.strerror)
    print("El error pertenece a la clase", e.__class__.__str__)
    print("Tipo de excepción:", e.__class__.__name__)
    print("Traza del error:", e.__traceback__)

Mensaje de error: El sistema no puede encontrar el archivo especificado
El error pertenece a la clase <slot wrapper '__str__' of 'OSError' objects>
Tipo de excepción: FileNotFoundError
Traza del error: <traceback object at 0x000001A4B35AC740>


Como se puede observar el manejo de errores se realiza igual que en otros lenguajes de programación.

## Manejo de cadenas

Las cadenas de caracteres en Python también son muy parecidas al resto de lenguajes de programación.

Algunas operaciones y métodos comunes para manipular cadenas en Python son:

In [None]:
cadena1 = "Hola"
cadena2 = "Mundo"
cadena3 = cadena1 + " " + cadena2
print(cadena3)  # imprime "Hola Mundo"

Repetición de cadenas:

In [None]:
cadena = "Hola "
cadena_repetida = cadena * 3
print(cadena_repetida)  # imprime "Hola Hola Hola "

Acceso a caracteres:

In [None]:
cadena = "Hola mundo"

primer_caracter = cadena[0]

Slicing:

In [40]:
cadena = "Hola Mundo"
subcadena = cadena[3:7]  # "a Mu"
subcadena = cadena[:6]   # "Hola M"

Tambien podemos hacer uso de las funciones integradas de Python para el manejo de cadenas, como por ejemplo:

In [42]:
cadena = "Hola Mundo"

print(cadena.upper())

print(cadena.lower())

print(cadena.split(" "))

print(cadena.replace("o","a"))

HOLA MUNDO
hola mundo
['Hola', 'Mundo']
Hala Munda


También podemos hacer uso de expresiones regulares para encontrar patrones, por ejemplo:

In [52]:
import re

# Cadena de texto donde se va a buscar el patrón
cadena = "Hola, mi nombre es Juan y mi correo es juan@gmail.com"

# Patrón a buscar en la cadena de texto
patron = r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}"

# Buscar el patrón en la cadena de texto
resultado = re.search(patron, cadena)

if resultado:
    # Imprimir el patrón encontrado
    print(resultado.group())
else:
    print("Patrón no encontrado")

juan@gmail.com


Si hubiera varios correos:

In [53]:
import re

# Cadena de texto donde se van a buscar los patrones
cadena = "Hola, mi nombre es Juan y mi correo es juan@gmail.com. También tengo una dirección alternativa en juan.perez@outlook.com"

# Patrón a buscar en la cadena de texto
patron = r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}"

# Buscar todas las ocurrencias del patrón en la cadena de texto
resultados = re.finditer(patron, cadena)

# Imprimir todos los patrones encontrados
for resultado in resultados:
    print(resultado.group())

juan@gmail.com
juan.perez@outlook.com


## Listas y diccionarios

Las listas y los diccionarios son estructuras de datos muy útiles en Python que pueden ayudarte a organizar y almacenar información de manera eficiente.

Una lista es una secuencia ordenada de elementos. Puedes crear una lista en Python utilizando corchetes y separando cada elemento con una coma. Por ejemplo:

In [54]:
mi_lista = [1, 2, 3, 4, 5]

for elemento in mi_lista:
    print(elemento)

1
2
3
4
5


Puedes acceder a los elementos de una lista por su índice, que es la posición del elemento en la lista. Los índices en Python comienzan en 0, por lo que el primer elemento de una lista tiene índice 0, el segundo elemento tiene índice 1, y así sucesivamente.

También puedes modificar los elementos de una lista utilizando el índice.

Por ejemplo:

In [55]:
print(mi_lista[0])  # Imprime 1
print(mi_lista[1])  # Imprime 2
print(mi_lista[4])  # Imprime 5

mi_lista[0] = 10
print(mi_lista[0])  # Imprime 10

1
2
5
10


Además, puedes utilizar los operadores de slicing (:) para obtener un subconjunto de elementos de una lista. Por ejemplo:

In [56]:
print(mi_lista[1:3])  # Imprime [2, 3]
print(mi_lista[:3])   # Imprime [10, 2, 3]
print(mi_lista[3:])   # Imprime [4, 5]

[2, 3]
[10, 2, 3]
[4, 5]


Como ya ojeamos anteriormente, un diccionario es una estructura de datos que almacena pares de valores clave-valor. Puedes crear un diccionario en Python utilizando llaves y separando cada par clave-valor con una coma. Las claves deben ser únicas dentro de un diccionario. Por ejemplo:

In [58]:
mi_diccionario = {'clave1': 'valor1', 'clave2': 'valor2', 'clave3': 'valor3'}


# Para acceder a un valor usamos su clave

print(mi_diccionario['clave1'])  # Imprime 'valor1'
print(mi_diccionario['clave2'])  # Imprime 'valor2'

mi_diccionario['clave1'] = 'nuevo valor'
print(mi_diccionario['clave1'])  # Imprime 'nuevo valor'


valor5
valor2
nuevo valor


### Otras estructuras de datos

Python ofrece muchas estructuras de datos para organizar la información, como ya hemos visto.

Una de ellas es el "Set" o conjunto. 

Un ejemplo práctico de uso de conjuntos podría ser para eliminar elementos duplicados de una lista.

Podemos eliminar los elementos duplicados de esta lista convirtiéndola primero a un conjunto, y luego volviéndola a convertir a una lista:

In [59]:
numeros = [1, 2, 3, 3, 4, 5, 5, 6, 6, 6]

sin_duplicados = list(set(numeros))
print(sin_duplicados)  # Imprime [1, 2, 3, 4, 5, 6]

[1, 2, 3, 4, 5, 6]


Otro uso común de los conjuntos es para realizar operaciones de conjuntos, como la unión, intersección y diferencia. Por ejemplo:

In [61]:
conjunto_a = {'Juan', 'Pedro', 'Ana'}
conjunto_b = {'Ana', 'Pablo', 'Mario'}

# Unión de los dos conjuntos
unio = conjunto_a.union(conjunto_b)
print(unio)  

# Intersección de los dos conjuntos
interseccion = conjunto_a.intersection(conjunto_b)
print(interseccion)  

# Diferencia entre el primer conjunto y el segundo
diferencia = conjunto_a.difference(conjunto_b)
print(diferencia)  

{'Juan', 'Pedro', 'Mario', 'Pablo', 'Ana'}
{'Ana'}
{'Juan', 'Pedro'}


## Leer y tratar ficheros


In [15]:
import csv

# Abrir el archivo en modo lectura
with open('airtravel.csv', 'r') as f:
    # Crear un objeto reader a partir del archivo
    reader = csv.reader(f)

    headers = next(reader) #Ignorar la cabecera
    print(headers)
  
  # Iterar sobre las filas del archivo
    for row in reader:
        # Procesar cada fila
        print(row)


['Month', ' "1958"', ' "1959"', ' "1960"']
['JAN', '340', '360', '417']
['FEB', '318', '342', '391']
['MAR', '362', '406', '419']
['APR', '348', '396', '461']
['MAY', '363', '420', '472']
['JUN', '435', '472', '535']
['JUL', '491', '548', '622']
['AUG', '505', '559', '606']
['SEP', '404', '463', '508']
['OCT', '359', '407', '461']
['NOV', '310', '362', '390']
['DEC', '337', '405', '432']


In [17]:
import csv

# Abrir el archivo en modo lectura
with open('airtravel.csv', 'r') as f:
    # Crear un objeto reader a partir del archivo
    reader = csv.reader(f)

    
    headers = next(reader) #Ignorar la cabecera
    print(headers)

    avg_months = []

    # Iterar sobre las filas del archivo
    for row in reader:
        # Procesar cada fila
        avg_months.append({row[0]+"_avg":row[0], "avg_flights":round(sum(map(int,row[1:]))/len(row[1:]),2)})

    print(avg_months)

['Month', ' "1958"', ' "1959"', ' "1960"']
[{'JAN_avg': 'JAN', 'avg_flights': 372.33}, {'FEB_avg': 'FEB', 'avg_flights': 350.33}, {'MAR_avg': 'MAR', 'avg_flights': 395.67}, {'APR_avg': 'APR', 'avg_flights': 401.67}, {'MAY_avg': 'MAY', 'avg_flights': 418.33}, {'JUN_avg': 'JUN', 'avg_flights': 480.67}, {'JUL_avg': 'JUL', 'avg_flights': 553.67}, {'AUG_avg': 'AUG', 'avg_flights': 556.67}, {'SEP_avg': 'SEP', 'avg_flights': 458.33}, {'OCT_avg': 'OCT', 'avg_flights': 409.0}, {'NOV_avg': 'NOV', 'avg_flights': 354.0}, {'DEC_avg': 'DEC', 'avg_flights': 391.33}]


1285.5
