## Introducción

- **I/O** significa _input/output_. 
- Escribir y leer datos desde archivos u otras fuentes, es fundamental en la programación, y más aún en programación científica.


## Leer archivos

In [1]:
%%file inout.dat
Hola, desde el archivo
Este es un archivo de texto
Escrito en ASCII

Writing inout.dat


Lee el archivo de una sola pasada

In [2]:
archivo = open('inout.dat')
print (archivo.read())
archivo.close()

Hola, desde el archivo
Este es un archivo de texto
Escrito en ASCII



Línea por línea

In [3]:
archivo = open('inout.dat')
print(archivo.readlines())
archivo.close()

['Hola, desde el archivo\n', 'Este es un archivo de texto\n', 'Escrito en ASCII\n']


Otra manera

In [4]:
for line in open('inout.dat'):
    print (line.split())

['Hola,', 'desde', 'el', 'archivo']
['Este', 'es', 'un', 'archivo', 'de', 'texto']
['Escrito', 'en', 'ASCII']


## Escribir archivos

`write()` es lo contrario a `read()` (¡Vaya sorpresa!)

In [5]:
contents = open('inout.dat').read()
out = open('my_output.dat', 'w')
out.write(contents.replace(' ', '_'))
out.close()

In [6]:
!cat my_output.dat

Hola,_desde_el_archivo
Este_es_un_archivo_de_texto
Escrito_en_ASCII


<div class="alert alert-info">
**Ejercicio** Cambia la segunda línea del archivo a _¿Cómo has estado?_ ¿Qué sucede?
</div>

In [9]:
archivo = open('inout.dat')
print (archivo.read())
archivo.close()

Hola, desde el archivo
Este es un archivo de texto
Escrito en ASCII



In [10]:
for line in open('inout.dat'):
    print (line.split())


['Hola,', 'desde', 'el', 'archivo']
['Este', 'es', 'un', 'archivo', 'de', 'texto']
['Escrito', 'en', 'ASCII']


In [29]:
contents = open('inout.dat').read()
lista=contents.split('\n')
out = open('inout.dat', 'w')
out.write(contents.replace(lista[1], '¿Cómo has estado?_¿Qué sucede?'))
out.close()

In [30]:
!cat my_output.dat

Hola, desde el archivo
¿Cómo has estado?_¿Qué sucede?
Escrito en ASCII
Hola, desde el archivo
¿Cómo has estado?_¿Qué sucede?
Escrito en ASCII
Hola, desde el archivo
¿Cómo has estado?_¿Qué sucede?
Escrito en ASCII
Hola, desde el archivo
¿Cómo has estado?_¿Qué sucede?
Escrito en ASCII


<div class="alert alert-info">
**Ejercicio** Escribe un archivo `CSV`. Calcula $y(x) = x^2 \cos x$ para los valores del $x \in {1..100}$. En la primera columna guarda $x$ y en la segunda $y(x)$.
</div>

In [31]:
import math
out = open('archivo.csv', 'w')
for x in range(1,101):
    #out.write('{},{}\n'.format(x, x**2*math.cos(x)))\
    out.write( str(x) + ',' + str(x**2*math.cos(x)) +','+str(x**3 * math.sin(x))+ '\n')
out.close()

contents=open('archivo.csv').readlines()
contents
out = open('2.csv','w')
for line in contents:
    x = int(line.split(',')[0])
    out.write(line.replace('\n','')+','+str(x**3*math.sin(x))+'\n')
out.close()
!cat 2.csv

1,0.5403023058681398,0.8414709848078965,0.8414709848078965
2,-1.6645873461885696,7.274379414605454,7.274379414605454
3,-8.909932469404009,3.810240217616415,3.810240217616415
4,-10.458297933817791,-48.435359699707405,-48.435359699707405
5,7.091554636580656,-119.86553433289231,-119.86553433289231
6,34.566130319413176,-60.353747610967986,-60.353747610967986
7,36.94121046282193,225.34640336054466,225.34640336054466
8,-9.312002163751266,506.5514222711715,506.5514222711715
9,-73.80155121265884,300.43437574124056,300.43437574124056
10,-83.90715290764524,-544.0211108893698,-544.0211108893698
11,0.5355094565541451,-1330.9869649189864,-1330.9869649189864
12,121.51497005747886,-927.1980023047515,-927.1980023047515
13,153.35850606508316,923.1069799081301,923.1069799081301
14,26.800494768735387,2718.226584026724,2718.226584026724
15,-170.9297803932348,2194.7214605302693,2194.7214605302693
16,-245.16082696278647,-1179.2519850601075,-1179.2519850601075
17,-79.52220469691152,-4723.3458

## Numpy I/O

In [None]:
%pylab inline
import numpy as np
import matplotlib.pyplot as plt

- `NumPy` permite escribir y leer los arreglos a archivo de varias maneras, como **texto** o en **binario**.
- Si escribes a un archivo usando el modo de **texto**, el número $\pi$, se escribirá como $3.141592653589793$. Algo que un humano puede leer (bajo ciertas condiciones, obvio), es decir, una cadena de texto. El modo de texto, ocupa más espacio, la precisión se puede perder (no todos los dígitos se escribirán al disco), pero puede ser editada a mano. Si guardas un arreglo, sólo se pueden guardar arreglos bidimensionales.
- En cambio, si usas el modo **binario** para escribir a archivo, se escribirá como una cadena de 8 bytes que será idéntica a como se guarda en la memoria de la computadora. Sus únicas desventaja es que no puede ser editado a mano y que es dependiente de `NumPy` (no puede ser leído por otro programa, sin un convertidor).

## Modo Texto

In [None]:
arr = np.arange(100).reshape(10, 10)
np.savetxt('test.out', arr, fmt='%.2e', header="My dataset")
!cat test.out

In [None]:
DataIn = np.loadtxt('test.out')
print (DataIn.shape)
print (DataIn)

In [None]:
print (DataIn[1,:])

#### Leyendo archivos CSV

In [None]:
%%file input.csv
# Mis datos de ejemplo
    0.0,  1.1,  0.1
    2.0,  1.9,  0.2
    4.0,  3.2,  0.1
    6.0,  4.0,  0.3
    8.0,  5.9,  0.3

In [None]:
!cat input.csv

In [None]:
x, y = np.loadtxt('input.csv', unpack=True, delimiter=',', usecols=[0,1])
print(x,y)

## Modo Binario

Para guardar datos binarios, `NumPy` provee los métodos `np.save` y `np.savez`. El primero sólo guarda un arreglo y el archivo tendrá la extensión `.npy`, mientras que el segundo se puede utilizar para guardar varios arreglos a la vez con una extensión `.npz`.

In [None]:
arr2 = DataIn 
np.save('test.npy', arr2)
# Lo leemos de nuevo
arr2n = np.load('test.npy')
# Veamos si hay una diferencia...
print( 'Any differences?', np.any(arr2-arr2n))

In [None]:
np.savez('test.npz', arr, arr2)
arrays = np.load('test.npz')
arrays.files

In [None]:
np.savez('test.npz', array1=arr, array2=arr2)
arrays = np.load('test.npz')
arrays.files

In [None]:
print( 'First row of first array:', arrays['array1'][0])
# Este es una manera equivalente de obtener el primer elemento
print ('First row of first array:', arrays.f.array1[0])

<div class="alert alert-info">
**Ejercicio**: <br/>
- Crea un arreglo bidimensional con 100 elementos flotantes al azar y guárdalos en formato de texto. <br/>

- Guárdalos también en formato binario. ¿Hay alguna diferencia entre ellos? <br/>

- Ahora crea un arreglo tridimensional con los elementos del 1 al 50 y guárdalos en formato binario ¿Qué pasa si los quieres guardar en formato de texto?
</div>