# Manejo de Archivos
En este cuaderno se cubren los temas básicos para el manejo de archivos: 
 1. Como abrir y cerrar archivos
 2. Uso del bloque <code>do</code> en archivos
 3. Lectura y escritura de archivos 

## Abrir y cerrar archivos
Para poder acceder a un archivo en Julia generalmente se utiliza la función <code>open()</code>. Dentro de su argumento se coloca el camino al archivo en el caso que el archivo se encuentre en un folder diferente al actual. Si se desea saber el folder actual donde se está trabajando en Julia se puede utilizar la función <code>pwd()</code>. 

Existen diferentes keywords que se le pueden agregar a la función <code>open()</code> las cuales indican lo que se quiere poder realizar con el archivo. Por defecto el archivo se abre __solo__ para lectura. 


| Keyword | Función |
| --- | --- |
| r | lectura |
| w | escritura, creación |
| a | escritura, creación, append |
| r+ | escritura, lectura |
| w+ | escritura, creación, lectura |
| a+ | append, escritura, lectura |

Por ejemplo, para abrir un archivo de prueba se puede hacer:


In [1]:
f = open("test.txt", "r") 

IOStream(<file test.txt>)

Lo anterior abre el archivo y lo adjunta el nombre <code>f</code> el cual representa el archivo. Para cerrar el archivo se utiliza la funcion <code>close()</code> de la siguiente forma: 

In [2]:
close(f)

## Bloques <code>do</code> y lectura de archivos
En Julia generalmente se utiliza un bloque <code>do</code> para el manejo de archivos, esto dado que cuando se termina de realizar el código deseado sobre el archivo, este usualmente se cierra. Además de que generalmente no se requiere mantener el archivo abierto todo el tiempo que se corre un programa.

Por otro lado, para leer los contenidos de un archivo existen variadas maneras, una es por medio de la función <code>read()</code> a esta función se le indica el archivo a leer y el tipo de variable a leer. Por ejemplo, si leer un <code>Int</code> un <code>Char</code>, <code>String</code>, etc. La función se detiene cuando encuentra un valor del tipo requerido.  

Por ejemplo, entonces:


In [3]:
open("test.txt", "r") do f
    read(f, String)
end 

"Lorem ipsum dolor sit amet, consectetur adipiscing \nelit. Cras orci justo, lacinia a odio vel, lobortis \nsodales urna. Curabitur augue sem, tristique ac \nsuscipit nec, facilisis nec dolor. "

Se debe tomar en cuenta que al leer por este método se leen los comandos <code>newline \n</code>. Por tanto, se debe utilizar tomando lo anterior en cuenta. Para revisar si un archivo está abierto o no se puede utilizar la función <code>isopen()</code>

In [4]:
isopen(f)

false

In [5]:
open("test.txt", "r") do f
    read(f, Char)
end

'L': ASCII/Unicode U+004C (category Lu: Letter, uppercase)

In [6]:
open("test.txt", "r") do f
    read(f, Int8)
end

76

La función <code>read()</code> retorna el valor del tipo pedido, este valor puede ser guardado en una variable. Por ejemplo, para guardar los contenidos de todo un archivo se puede hacer:

In [7]:
open("test.txt", "r") do f
    content = read(f, String)
end 

"Lorem ipsum dolor sit amet, consectetur adipiscing \nelit. Cras orci justo, lacinia a odio vel, lobortis \nsodales urna. Curabitur augue sem, tristique ac \nsuscipit nec, facilisis nec dolor. "

Lo anterior toma todo el contenido del archivo el cual se lee como un <code>String</code> y lo guarda en la variable <code>content</code>. Una particularidad de utilizar <code>do</code> es que las variables creadas dentro de ese bloque de codigo son locales. Para poder accesarlas fuera del bloque se puede hacer algo como:

In [8]:
content = open("test.txt", "r") do f
     read(f, String)
end 
content

"Lorem ipsum dolor sit amet, consectetur adipiscing \nelit. Cras orci justo, lacinia a odio vel, lobortis \nsodales urna. Curabitur augue sem, tristique ac \nsuscipit nec, facilisis nec dolor. "

Los bloques <code>do</code> funcionan similar a las funciones donde la última línea contiene lo que se retorna del bloque, en el caso anterior entonces el contenido del archivo se retorna y se asigna a <code>content</code>. También se permite retornar más de una cosa, por ejemplo:

In [9]:
line1, line2 = open("test.txt", "r") do f
    line1 = readline(f)
    line2 = readline(f)
    (line1, line2)
end 

("Lorem ipsum dolor sit amet, consectetur adipiscing ", "elit. Cras orci justo, lacinia a odio vel, lobortis ")

Lo anterior retorna las dos primeras líneas del documento por medio de la función <code>readline()</code>, cuando se lee una línea se deja un marcador al inicio de la siguiente línea y por tanto se pueden leer líneas de forma continua agregando más funciones <code>readline()</code>. Por otro lado, los valores de las dos líneas se retornan por medio de un __Tuple__ que las contiene. Estas luego se asignan a las variables <code>line1</code> y <code>line2</code> respectivamente.

Tomando la función anterior <code>readline()</code> se puede crear un pedazo de código el cual itere sobre todas las líneas de un archivo, por ejemplo:

In [10]:
open("test.txt", "r") do f
    while(!eof(f))
        println(readline(f))
    end
end

Lorem ipsum dolor sit amet, consectetur adipiscing 
elit. Cras orci justo, lacinia a odio vel, lobortis 
sodales urna. Curabitur augue sem, tristique ac 
suscipit nec, facilisis nec dolor. 


El código anterior utiliza la función <code>eof()</code> a la cual se le pasa como argumento el archivo, la función luego retorna si ya se llegó al final de este. Si se ha llegado al final del archivo se retorna <code>true</code>. Lo anterior es solo una de las varias formas que se pueden utilizar, por ejemplo:

In [11]:
open("test.txt", "r") do f
    for i in eachline(f)
        println(i)
    end
end

Lorem ipsum dolor sit amet, consectetur adipiscing 
elit. Cras orci justo, lacinia a odio vel, lobortis 
sodales urna. Curabitur augue sem, tristique ac 
suscipit nec, facilisis nec dolor. 


La forma anterior utiliza la función <code>eachline()</code> la cual retorna un objeto iterable que contiene las líneas del texto. Por tanto, el <code>for</code> anterior itera sobre todas las líneas del texto hasta que termina. Otra forma:

In [12]:
open("test.txt", "r") do f
    for i in readlines(f)
        println(i)
    end
end

Lorem ipsum dolor sit amet, consectetur adipiscing 
elit. Cras orci justo, lacinia a odio vel, lobortis 
sodales urna. Curabitur augue sem, tristique ac 
suscipit nec, facilisis nec dolor. 


Esta otra forma utiliza la función <code>readlines()</code> la cual retorna todas las líneas del texto en un arreglo sobre el cual se pude iterar, muy similar a utilizar <code>eachline()</code>.

## Escritura de Archivos 
Para escribir a un archivo se utiliza la función <code>write()</code>. A dicha función se le dice donde escribir y los datos a escribir. Por ejemplo, creando un archivo de prueba:

In [13]:
open("write_test.txt", "w+") do f
    write(f, "Soy un texto de prueba \n")
end

24

Lo anterior crea un archivo de prueba y lo llena con el contenido definido, correr varias veces el código no llena el archivo más veces. Si más bien lo que se desea es agregar contenido al archivo en otras palabras hacer <code>append</code> al archivo se debe abrir de la siguiente forma:

In [14]:
open("write_test.txt", "a+") do f
    write(f, "Soy otra linea de prueba \n")
end 

26

En base en lo anterior se pueden hacer cosas mucho más complejas, por ejemplo, escribiendo una matriz al archivo:

In [15]:
nums() = rand(1:10, 3)

open("write_test.txt", "w+") do f
    for i in 1:3
        n1, n2, n3 = nums()
        write(f, "$n1 $n2 $n3 \n")
    end
end

El código anterior escribe una matriz 3x3 en el archivo de valores aleatorios. Para leerlo se puede hacer de varias formas, una forma útil para la lectura de este tipo de estructuras es por medio del paquete <code>DelimitedFiles</code>. Dentro de este está la función <code>readdlm()</code> a dicha función se le pueden pasar diferentes parámetros de entrada, entre los cuales están:

- El archivo
- El separador de valores, sino se indica se asumen espacios
- El tipo de variable a leer, <code>Float</code>, <code>Int</code>, etc.
- Carácter de final de fila, sino se indica se asume <code>\n</code>

Existen otros parámetros de entrada que no son tan útiles para los ejemplos mostrados a continuación.


In [16]:
using DelimitedFiles
readdlm("write_test.txt", Int)

3×3 Array{Int64,2}:
 8  2  4
 8  9  1
 3  8  3

También dentro de este paquete se pueden escribir matrices o arreglos de forma fácil por medio de la función <code>writedlm()</code> a dicha función se le indica el archivo, el vector o matriz a guardar y como opcional se puede elegir un delimitador para cada valor. Primero para una matriz se utiliza como delimitador entre valores un espacio:

In [17]:
open("write_test.txt", "w+") do f
    writedlm(f, rand(5,5), ' ')
end
readdlm("write_test.txt", Float32)

5×5 Array{Float32,2}:
 0.672107   0.486917  0.55973    0.299977  0.220677
 0.0779645  0.829956  0.243579   0.666183  0.533286
 0.575215   0.523428  0.013715   0.19967   0.562412
 0.646621   0.950588  0.0347743  0.259135  0.147738
 0.70959    0.729563  0.556871   0.986827  0.876042

Para un arreglo:

In [18]:
open("write_test.txt", "w+") do f
    writedlm(f, rand(1:10, 10), ' ')
end
readdlm("write_test.txt", Int)

10×1 Array{Int64,2}:
  6
  9
  9
  6
  7
  5
  5
  5
  5
 10