<h1>Archivos</h1>
<p>
    Hasta el momento solo se ha trabajado con valores y textos generados en el mismo código para realizar pruebas y trabajar con las funciones que hemos creado, pero la verdad es que en la realidad gran parte de los datos que consumirán nuestros procesos provienen de elementos completamente externos (archivos de textos, excel, incluso imágenes, vídeos, audios, entre muchos otros más).
</p>
<p>
    Dado lo anterior es importante conocer que con Python podemos leer distintos tipos de archivos y que posee funciones especiales para lograr este objetivo. Pero antes de entrar a la lectura, crearemos un archivo e insertaremos texto en él.
</p>

<h2>Crear y escribir archivos</h2>
<p>
    Para este caso, iremos a un ejemplo muy clásico dentró del mundo de la programación y crearemos un archivo que abra un archivo de texto (puede existir o no) y escribiremos en él la frase "Hola Mundo !". Para lograr esto se puede hacer por medio del siguiente código.
</p>

In [2]:
# Se abre el documento para comenzar con su escritura. Esta instrucción se asigna a un variable "f"
f = open('holamundo.txt','w')

In [3]:
# Dentro de write() se ingresa el texto a escribir. Esta función devuelve como resultado el largo del texto escrito.
f.write('hola mundo\n')

11

In [4]:
# Instrucción para cerrar el documento una vez hecho todos los cambios
f.close()

<p>
    También, para omitir el paso de cerrar el documento, nos podemos apoyar del comando <code>with</code>. De esta forma, todas las instrucciones realizadas dentro de él se harán con el documento abierto, para que, una vez se haya finalizado, este se cierre. Este método ayuda no solo a quitar una línea de código, sino que también a mantener organizada cada tarea relacionada a la escritura (o lectura del documento).
</p>

In [23]:
with open('holamundo.txt','w') as f:
    f.write('hola mundo\n')
    f.write('chao mundo')

<p>
    Para entender bien como funciona todo esto, se explicará paso a paso cada acción realizada.
    <ol>
        <li><code>f = open('holamundo.txt','w')</code> o <code>with open('holamundo.txt','w') as f:</code>: En este caso el comando <code>open</code> indica que abrirá un archivo, el primer parámetro, que en este caso corresponde a <code>'holamundo.txt'</code> indica la ruta del archivo que desea abrir (en caso de que este archivo no exista lo crea). El segundo parámetro <code>'w'</code> indica que acción realizará con el archivo, en este caso la <code>'w'</code> indica que se abrirá el archivo con el fin de escribir en él. Se asigna esta instrucción a una variable <code>f</code> con la que nos comunicaremos para hacer cada tarea.
        </li>
        <li><code>f.write('hola mundo\n')</code>: Función con la se escribe en el archivo texto. Dentro de la función se ingresael texto, el cual puede ser también una variable.
        </li>
        <li><code>f.close()</code>: Una vez se haya terminado de trabajar con el archivo, es importante cerrarlo y gracias a este comando se logra esto. Si se utiliza el comando <code>with</code> este se omite.
        </li>
    </ol>
    Es importante destacar que este comando reescribe por completo el archivo, por lo que si se utiliza <code>'w'</code> eliminará todo el contenido ya existente en el archivo y escribirá el nuevo. En el caso de que se desee escribir al final del texto ya existente se puede reemplazar la <code>'w'</code> por <code>'a'</code>.
</p>

In [24]:
f = open('holamundo.txt','a')
f.write('\nhola mundo')
f.close()

<h2>Lectura de archivos</h2>
<p>
    La escritura de archivos es vital a la hora de guardar información y datos generados en el código de forma local y si se requieren para otra proceso, pero antes de eso, de algún lugar debemos consumir la información. Es por esto que en este punto se explicará y mostrará la forma de leer un archivo. A continuación, se entrega la función que permite esto:
</p>

In [25]:
with open('holamundo.txt','r') as f:
    mensaje = f.read()
    print(mensaje)

hola mundo
chao mundo
hola mundo


<p>
    Podemos observar que las funciones entre lectura y escritura (agregar o sobreescribir) son muy similares, con la diferencia de que en lectura, en lugar de usar el comando <code>f.write()</code> se utiliza el de <code>f.read()</code>. Este último comando permite leer el contenido del texto y lo podemos almacenar en una variable para poder utilizarlo de la forma que necesitemos. En este caso se agrega la función de <code>print()</code> para mostrar el contenido del texto imprimiendo la varible en la que se almacenó.
</p>

<h3>Lectura en profundidad</h3>
<p>
    Al momento de leer un archivo, primero se debe abrir, se debe considerar que todo este trabajo es similar a si una persona hiciera esto directamente. El usuario, una vez abre el archivo, puede ir navegando por él y posicionado su cursor en distintas líneas. Python trabaja de forma muy similar. Cuando Python abre el archivo, el cursos siempre empieza en la primera posición del documento y, dependiendo del comando utilizado, uno puede ir extrayendo el texto completo, linea por linea e incluso carácter por carácter.
</p>
<center>
    <img src="https://media1.giphy.com/media/3o6MblAa0uE3a77V5K/giphy.gif?cid=ecf05e471olve054kiwd1fj8eascvomqzswj5a9py5bnyvba&rid=giphy.gif&ct=g">
</center>
<p>
    Hasta el momento se ha visto como leer un archivo y, si bien, pareciera que con el comando <code>read()</code> se leyera el archivo completo, tecnicamente no es así. Para entender por qué ocurre esto, es importante mencionar que existen tres formas de leer un archivo: <code>read()</code>, <code>readline()</code> y <code>readlines()</code>. A continuación se entrega el detalle de cada una de estas:
    <ul>
    <li><code>read()</code>: Comando utilizado en el ejemplo anterior para leer un archivo. Este comando lee desde la posición en la que se encuentra el cursos, hasta el final del documento.
        <center><img src="./images/read_command.png"></center></li>
    </ul>
    <li><code>readline()</code>: Permite leer una sola línea de texto y desde el punto que quedó el cursor hasta el final de la línea.
        <center><img src="./images/readline_command.png"></center></li>
    </ul>
    <li><code>readlines()</code>: Similar al caso anterior, lee una línea, pero lo hace de manera cíclica, leyendo todo el documento (o desde el último punto en el que haya quedado posicionado el cursor) y cada línea la guardar de manera separada en una lista.
        <center><img src="./images/readlines_command.png"></center></li>
    </ul>
</p>
<p>
    Es importante destacar que, sin importar cual sea el caso, si algunas de estas funciones es utilizada estando el cursor en la última línea del documento, devolverá un espacio en blanco, es decir: "".
</p>
<p>
    Para entender mejor su funcionamiento, a continuación se entregan las funciones sobre el mismo documento mostrado en el ejemplo:
</p>

<h3>Ejemplo funciones de lectura</h3>
<p>
    Para este caso se trabajará con un documento llamado "saludo.txt". El texto que contiene es el siguiente:
</p>
<p>
<code>Hola a todos !
Como estan?
Espero que tengan un buen dia
Y que les vaya bien</code>
</p>

<h4>Uso de <code>read()</code> & <code>readline()</code></h4>

In [9]:
with open('saludo.txt','r') as f:
    # Dado que el documento acaba de ser abierto, esta función leerá una sola línea y será la primera
    mensaje1 = f.readline()
    print("mensaje 1:\n" + mensaje1)
    
    # Ya habiendo leído la primera línea, el cursor parte desde la segunda y es esta misma la que devuelve esta función.
    mensaje2 = f.readline()
    print("mensaje 2:\n" + mensaje2)
    
    # El curso ahora se encuentra en la tercera línea y, dado que ahora se utiliza "read()" se lee desde este punto
    # hasta el final del documento
    mensaje3 = f.read()
    print("mensaje 3:\n" + mensaje3)
    
    # Ya habiendo leído el documento completo, el cursor se posiciona en el última lugar posible,
    # por lo que el resultado de esta función será un espacio en blanco ("").
    mensaje4 = f.read()
    print("mensaje 4:\n" + mensaje4)

mensaje 1:
Hola a todos !

mensaje 2:
Como estan?

mensaje 3:
Espero que tengan un buen dia
Y que les vaya bien
mensaje 4:



<p>
    Tal como se mencionó en su momento, con cada lectura se recorre el documento
    <ol>
        <li>Primero se imprime la primera línea con <code>readline()</code> que corresponde a <code>Hola a todos !</code>, además posiciona el cursor al final de esta misma línea.</li>
        <li>Partiendo desde la posición que quedó, imprime la segunda línea usando el mismo comando que antes, devolviendo como resultado <code>Como estan?</code></li>
        <li>El penultimo paso, dado que utiliza la función <code>read()</code>, termina de leer documento partiendo desde la posición que quedó hasta la última línea.</li>
        <li>Por último, se vuelve a llamar la función <code>read()</code>, pero dado que el cursor ya se encuentra en la última línea y no queda nada más para leer, solo devuelve un carácter vacío ("").</li>
    </ol>
    Dado que estas son todas las tareas que tiene el <code>with</code>, una vez las termina de ejecutar se cierra el documento.
</p>

<h4>Uso de <code>realines()</code></h4>
<p>
    Esta función nos permitirá leer todo el documento (o desde el punto en el que se encuentre el cursor) y almacenar cada línea de este en una lista, cada una como string. A continuación se entrega un ejemplo usando el mismo documento del caso anterior.
</p>

In [15]:
with open('saludo.txt','r') as f:
    lista = f.readlines()
print("El documento tiene " + str(len(lista)) + " líneas.")
print("\nDocumento (lista de líneas):")
print(lista)

El documento tiene 4 líneas.

Documento (lista de líneas):
['Hola a todos !\n', 'Como estan?\n', 'Espero que tengan un buen dia\n', 'Y que les vaya bien']


<p>
    En este caso todo el documento y cada línea de él pasa a ser un elemento de una lista, que está ordenada de la misma forma en la que se ubica cada fila dentro del archivo.
</p>
<p>
    También se pueden combinar las funciones anteriores con esta, por ejemplo, si necesitamos leer un archivo que contiene datos con su encabezado correspondiente y valores, podemos primero usar <code>readline()</code>, para extraer el encabezado y luego utilizamos <code>readlines()</code> para el resto del documento como lista.
</p>

In [17]:
with open('ventas.txt','r') as f:
    encabezados = f.readline()
    valores = f.readlines()
print("El encabezado del documento es:")
print(encabezados)
print("Los valores del documento son:")
print(valores)

El encabezado del documento es:
producto,cantidad,valor

Los valores del documento son:
['esponjas,30,500\n', 'confort,50,1000\n', 'pan,1.5,1000']


<p>
    Existen muchas otras formas en las que se pueden utilizar estos comandos, todo depende de lo que se necesite hacer.
    <center><img src="https://media4.giphy.com/media/DfSXiR60W9MVq/giphy.gif?cid=ecf05e47id36obhex2rruet4aip4ruem8rwhj0cocdaqol9d&rid=giphy.gif&ct=g"></center>
</p>

<h2>Ejercicios de práctica</h2>
<p>
    <ol>
        <li>Siento que ya he visto este archivo antes... ¡Veamos si es verdad! Se requiere tener un programa que compare dos archivos leyendo el contenido de ambos y devuelva un mensaje indicando si ambos archivos son exactamente iguales o distintos. Para este caso considerar que los nombres de los documentos son <code>archivo1.txt</code> y <code>archivo2.txt</code></li>
        <li>¡El mundo al revés! Se pide crear un programa que lea un documento llamado <code>orden.txt</code>. Este programa deberá invertir el orden del texto que se encuentra en cada línea del documento y escribirla en un archivo llamado <code>desorden.txt</code>. Las líneas deben se escritas en el mismo orden que en el documento original.
        <pre>Ejemplo:
        <strong>Entrada:</strong>
        Hola mundo !
        Como estan?
        Espero que bien !
        <strong>Salida:</strong>
        ! odnum aloH
        ?natse omoC
        ! neib euq orepsE
        </pre>
        </li>
        <li>
            ¿Cuántas vocales tenemos?... Se necesita conocer el número de vocales que tiene cada fila de un documento y para esto se le pide a usted que construya un programa que pueda leer un archivo de texto llamado <code>informe.txt</code>. La idea de esta función es que en un nuevo documento llamado <code>vocales.txt</code> escriba el número de veces que se repite cada vocal en cada línea, de acuerdo a la posición de esta en el documento original. También se pide adjuntar una fila adiciona al final del nuevo documento, en el que se entregue el total de cada una de las vocales que se encuentra en todo el documento. A continuación se entrega un ejemplo del forma de entrada y salida.
        <pre>
        <strong>Archivo "informe.txt" (Entrada):</strong>
        <code>Hola mundo !
        Como estan?
        Espero que bien !
        </code>
        <strong>Archivo "vocales.txt" (Salida):</strong>
        Línea 1 -> A: 1, E: 0, I: 0, O: 2, U: 1
        Línea 2 -> A: 1, E: 1, I: 0, O: 2, U: 0
        Línea 3 -> A: 0, E: 4, I: 1, O: 1, U: 1
        Totales -> A: 2, E: 5, I: 1, O: 5, U: 2
        </pre>
        </li>
    </ol>
</p>