<a href="https://colab.research.google.com/github/LuisAntonioGI13/Python-Curse/blob/main/Manejo_de_Ficheros.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##¿Qué es un fichero?

Primeramente, ¿qué es un fichero? Un fichero es un conjunto de bits almacenados en un dispositivo de memoria persistente, normalmente un disco duro. Este conjunto de información se identifica con un nombre (el nombre del fichero) y la dirección de la carpeta o directorio que lo contiene. Todos, absolutamente todos los ficheros se localizan en un directorio determinado que se conoce como la ruta del fichero.

Por cierto, los ficheros se conocen también como archivos informáticos porque son equivalentes digitales de los archivos escritos por ejemplo en expedientes, tarjetas o libretas que encontraríamos en una oficina tradicional.

Otra cosa importante es que los ficheros se suelen identificar también con una extensión. Una extensión es un código que se escribe después del nombre, con un punto y varios caracteres y que nos permite identificar varios ficheros de un mismo tipo. En realidad ésto no deja de ser una formalidad, ya que a nuestros programas no les importa la extensión, sino cómo deben interpretar los datos que hay escritos dentro.

##Operaciones básicas

Segundo, las cuatro operaciones que nos permiten los ficheros son:

* **Creación:** Proceso por el cual creamos un fichero en el disco.
* **Apertura:** Proceso por el cual abrimos un fichero del disco para comenzar a trabajar.
* **Cierre:** Proceso por el cual cerramos un fichero para dejar de trabajar con él.
* **Extensión:** Proceso por el cual añadimos información al fichero.
Es posible realizar varias operaciones a la vez, como creación y apertura en la misma instrucción. Sin embargo es necesario abrir un fichero para poder extenderlo o cerrarlo.

##Puntero del fichero
Tercero, el puntero es un concepto por el cual podemos entender como el ordenador accede y escribe en el fichero correctamente. Imaginaros el puntero como si fuera el dedo del ordenador mientras recorre el fichero, igual que nosotros seguimos con el dedo un texto mientras lo leemos y así sabemos por dónde vamos.

El puntero es muy importante, ya que por ejemplo, si se encuentra al principio del fichero y le decimos que guarde datos ahí, si no hay nada perfecto, pero si ya hay datos ¿que ocurrirá? Que los guardaremos encima de otros datos y quizá haremos que el fichero quede inservible. Entonces, ¿si queremos añadir datos al fichero, dónde debería estar el puntero? Pues al final del todo, justo donde no hay nada más.

##Ficheros de texto y binarios
Ésta es la última diferencia que debemos entender. Si probáis a crear un fichero con un editor de texto, luego lo podemos abrir cómodamente para seguir trabajando, como cuando creamos un script de Python. Ésto es porque los editores guardan la información en ficheros de texto plano, tal como nosotros lo escribimos.

Pero ¿qué ocurre si intentamos abrir una imagen o sonido con el editor? Pues que aparecen muchos códigos extraños.

La causa es que estos ficheros no almacenan texto plano, sino datos binarios. Los datos binarios son la forma básica de datos que un ordenador maneja, y por tanto también la forma más rápida de escribir y leer información de un fichero. Por éso sirven para guardar de todo, desde imágenes, sonidos, ficheros que a su vez han sido comprimidos, texto enriquecido (como el de un documento de word) o incluso el ejecutable de un programa. Lo malo es que para nosotros son más difíciles de manejar que los ficheros porque requieren conocimientos informáticos sobre el funcionamiento de los bits, bytes y las conversiones entre tipos, así que no los veremos.

##Ficheros de texto

Hay varias formas de abrir un fichero, la más común es utilizando la función open del módulo io

In [7]:
#Creación y escritura

from io import open

texto = "Una línea con texto\nOtra línea con texto"

# Ruta donde crearemos el fichero, w indica escritura (puntero al principio)
fichero = open('fichero.txt','w')

# Escribimos el texto
fichero.write(texto)

# Cerramos el fichero
fichero.close()


In [5]:
fichero

<_io.TextIOWrapper name='fichero.txt' mode='w' encoding='UTF-8'>

In [8]:
#Lectura

# Ruta donde leeremos el fichero, r indica lectura (por defecto ya es r)
fichero = open('fichero.txt','r')

# Lectura completa
texto = fichero.read()

# Cerramos el fichero
fichero.close()

print(texto)

Una línea con texto
Otra línea con texto


In [9]:
#Podemos usar el método readlines() del fichero para generar una lista con las líneas

fichero = open('fichero.txt','r')

# Leempos creando una lista de líneas
texto = fichero.readlines()

fichero.close()
print(texto)

['Una línea con texto\n', 'Otra línea con texto']


In [10]:
#También se puede leer un fichero utilizando la instrucción estándar with de la siguiente forma

with open("fichero.txt", "r") as fichero:
    for linea in fichero:
        print(linea)

Una línea con texto

Otra línea con texto


In [11]:
#Extensión
#Este modo nos permite añadir datos al final de un fichero

# Ruta donde leeremos el fichero, a indica extensión (puntero al final)
fichero = open('fichero.txt','a')

fichero.write('\nOtra línea más abajo del todo')

fichero.close()

In [12]:
#La variante 'a+' permite crear el fichero si no existe

fichero = open('fichero_inventado.txt','a+')

##Manejando el puntero

Es posible posicioar el puntero en el fichero manualmente usando el método seek e indicando un número de caracteres para luego leer una cantidad de caracteres con el método read

In [13]:
fichero = open('fichero.txt','r')
fichero.seek(0)   # Puntero al principio
fichero.read(10)  # Leemos 10 carácteres

'Una línea '

In [14]:
#Para posicionar el puntero justo al inicio de la segunda línea, podríamos ponerlo justo en la longitud de la primera


fichero = open('fichero.txt','r')
fichero.seek(0)

# Leemos la primera línea y situamos el puntero al principio de la segunda
fichero.seek( len(fichero.readline()) )

# Leemos todo lo que queda del puntero hasta el final
fichero.read()


'\nOtra línea con texto\nOtra línea más abajo del todo'

###Lectura con escritura

Se puede abrir un fichero en modo lectura con escritura, pero éste debe existir préviamente. Además por defecto el puntero estará al principio y si escribimos algo sobreescribiremos el contenido actual, así que prestad atención a los saltos de línea y caracteres especiales

In [15]:
# Creamos un fichero de prueba con 4 líneas
fichero = open('fichero2.txt','w')
texto = "Línea 1\nLínea 2\nLínea 3\nLínea 4"
fichero.write(texto)
fichero.close()

# Lo abrimos en lectura con escritura y escribimos algo
fichero = open('fichero2.txt','r+')
fichero.write("0123456")

# Volvemos a ponter el puntero al inicio y leemos hasta el final
fichero.seek(0)
fichero.read()
fichero.close()

###Modificar una línea

Para lograr este fin lo mejor es leer todas las líneas en una lista, modificar la línea en la lista, posicionar el puntero al principio y reescribir de nuevo todas las líneas

In [16]:
fichero = open('fichero2.txt','r+')
texto = fichero.readlines()

# Modificamos la línea que queramos a partir del índice
texto[2] = "Esta es la línea 3 modificada\n"

# Volvemos a ponter el puntero al inicio y reescribimos
fichero.seek(0)
fichero.writelines(texto)
fichero.close()

# Leemos el fichero de nuevo
with open("fichero2.txt", "r") as fichero:
    print(fichero.read())

01234561
Línea 2
Esta es la línea 3 modificada
Línea 4


##Módulo pickle

Este módulo nos permite almacenar fácilmente colecciones y objetos en ficheros binarios abstrayendo todo la parte de escritura y lectura binaria.

In [17]:
#Escritura de colecciones

import pickle

# Podemos guardar lo que queramos, listas, diccionarios, tuplas...
lista = [1,2,3,4,5]

# Escritura en modo binario, vacía el fichero si existe
fichero = open('lista.pckl','wb')

# Escribe la colección en el fichero
pickle.dump(lista, fichero)

fichero.close()

In [18]:
#Lectura de colecciones

# Lectura en modo binario
fichero = open('lista.pckl','rb')

# Cargamos los datos del fichero
lista_fichero = pickle.load(fichero)
print(lista_fichero)

fichero.close()

[1, 2, 3, 4, 5]


###Persistencia de objetos
Para guardar objetos lo haremos dentro de una colección. La lógica sería la siguiente:

1. rear una colección.
2. Introducir los objetos en la colección.
3. Guardar la colección haciendo un dump.
4. Recuperar la colección haciendo un load.
5. Seguir trabajando con nuestros objetos.

In [19]:
# Creamos una clase de prueba
class Persona:

    def __init__(self,nombre):
        self.nombre = nombre

    def __str__(self):
        return self.nombre

# Creamos la lista con los objetos
nombres = ["Héctor","Mario","Marta"]
personas = []

for n in nombres:
    p = Persona(n)
    personas.append(p)

# Escribimos la lista en el fichero con pickle
import pickle
f = open('personas.pckl','wb')
pickle.dump(personas, f)
f.close()

# Leemos la lista del fichero con pickle
f = open('personas.pckl','rb')
personas = pickle.load(f)
f.close()

for p in personas:
    print(p)

Héctor
Mario
Marta


###Ejemplo catálogo de películas

A continuación os dejo un ejemplo para que veáis como adaptar un catálogo de películas para usar persistencia utilizando pickle

In [20]:
from io import open
import pickle

class Pelicula:

    # Constructor de clase
    def __init__(self, titulo, duracion, lanzamiento):
        self.titulo = titulo
        self.duracion = duracion
        self.lanzamiento = lanzamiento
        print('Se ha creado la película:',self.titulo)

    def __str__(self):
        return '{} ({})'.format(self.titulo, self.lanzamiento)


class Catalogo:

    peliculas = []

    # Constructor de clase
    def __init__(self):
        self.cargar()

    def agregar(self,p):
        self.peliculas.append(p)
        self.guardar()

    def mostrar(self):
        if len(self.peliculas) == 0:
            print("El catálogo está vacío")
            return
        for p in self.peliculas:
            print(p)

    def cargar(self):
        fichero = open('catalogo.pckl', 'ab+')
        fichero.seek(0)
        try:
            self.peliculas = pickle.load(fichero)
        except:
            print("El fichero está vacío")
        finally:
            fichero.close()
            print("Se han cargado {} películas".format(len(self.peliculas)))

    def guardar(self):
        fichero = open('catalogo.pckl', 'wb')
        pickle.dump(self.peliculas, fichero)
        fichero.close()

In [21]:
# Creamos un catálogo
c = Catalogo()

# Mostramos el contenido
c.mostrar()

# Agregamos unas películas
c.agregar( Pelicula("El Padrino", 175, 1972) )
c.agregar( Pelicula("El Padrino: Parte 2", 202, 1974) )

# Mostramos el catálogo de nuevo
c.mostrar()

# Borramos el catálogo de la memoria ram (persistirá el fichero)
del(c)

El fichero está vacío
Se han cargado 0 películas
El catálogo está vacío
Se ha creado la película: El Padrino
Se ha creado la película: El Padrino: Parte 2
El Padrino (1972)
El Padrino: Parte 2 (1974)


In [22]:
# Creamos un catálogo
c = Catalogo()

# Mostramos el contenido
c.mostrar()

# Agregamos una película
c.agregar( Pelicula("Prueba", 100, 2005) )

# Mostramos el catálogo de nuevo
c.mostrar()

Se han cargado 2 películas
El Padrino (1972)
El Padrino: Parte 2 (1974)
Se ha creado la película: Prueba
El Padrino (1972)
El Padrino: Parte 2 (1974)
Prueba (2005)


##Ficheros CSV

In [23]:
#Escritura de listas en CSV

import csv

contactos = [
    ("Manuel", "Desarrollador Web", "manuel@ejemplo.com"),
    ("Lorena", "Gestora de proyectos", "lorena@ejemplo.com"),
    ("Javier", "Analista de datos", "javier@ejemplo.com"),
    ("Marta", "Experta en Python", "marta@ejemplo.com")
]

with open("contactos.csv", "w", newline="\n") as csvfile:
    writer = csv.writer(csvfile, delimiter=",")
    for contacto in contactos:
        writer.writerow(contacto)

In [28]:
#Lectura de listas en CSV

with open("contactos.csv", newline="\n") as csvfile:
    reader = csv.reader(csvfile, delimiter=",")
    for nombre, empleo, email in reader:
        print(" {}|{} |{} ".format(nombre, empleo, email))

 Manuel|Desarrollador Web |manuel@ejemplo.com 
 Lorena|Gestora de proyectos |lorena@ejemplo.com 
 Javier|Analista de datos |javier@ejemplo.com 
 Marta|Experta en Python |marta@ejemplo.com 


In [29]:
#Escritura de diccionarios en CSV

import csv

contactos = [
    ("Manuel", "Desarrollador Web", "manuel@ejemplo.com"),
    ("Lorena", "Gestora de proyectos", "lorena@ejemplo.com"),
    ("Javier", "Analista de datos", "javier@ejemplo.com"),
    ("Marta", "Experta en Python", "marta@ejemplo.com")
]

with open("contactos.csv", "w", newline="\n") as csvfile:
    campos = ["nombre", "empleo", "email"]
    writer = csv.DictWriter(csvfile, fieldnames=campos)
    writer.writeheader()
    for nombre, empleo, email in contactos:
        writer.writerow({
            "nombre": nombre, "empleo": empleo, "email": email
        })

In [30]:
#Lectura de diccionarios en CSV

with open("contactos.csv", newline="\n") as csvfile:
    reader = csv.DictReader(csvfile)
    for contacto in reader:
        print(contacto["nombre"], contacto["empleo"], contacto["email"])

Manuel Desarrollador Web manuel@ejemplo.com
Lorena Gestora de proyectos lorena@ejemplo.com
Javier Analista de datos javier@ejemplo.com
Marta Experta en Python marta@ejemplo.com


##Ficheros JSON

**JSON:** Notación de objeto de JavaScript (JavaScript Object Notation)

In [31]:
#Escritura de datos en JSON

import json

contactos = [
    ("Manuel", "Desarrollador Web", "manuel@ejemplo.com"),
    ("Lorena", "Gestora de proyectos", "lorena@ejemplo.com"),
    ("Javier", "Analista de datos", "javier@ejemplo.com"),
    ("Marta", "Experta en Python", "marta@ejemplo.com")
]

datos = []

for nombre, empleo, email in contactos:
    datos.append({"nombre":nombre, "empleo":empleo, "email":email})

with open("contactos.json", "w") as jsonfile:
    json.dump(datos, jsonfile)

In [32]:
#Lectura de datos en JSON
with open("contactos.json") as jsonfile:
    datos = json.load(jsonfile)
    for contacto in datos:
        print(contacto["nombre"], contacto["empleo"], contacto["email"])

Manuel Desarrollador Web manuel@ejemplo.com
Lorena Gestora de proyectos lorena@ejemplo.com
Javier Analista de datos javier@ejemplo.com
Marta Experta en Python marta@ejemplo.com
