# Uso de NumPy para leer archivos

Es posible usar el módulo NumPy para leer archivos .csv, o de otros tipos, y cargarlos directamente en arreglos.  Esto se puede hacer utilizando la función _**numpy.genfromtxt**_.  En este ejercicio lo utilizaremos para leer los datos en un archivo _clásico_ del repositorio **UCI Machine Learning Repository** llamado _winequality-red.csv_ que tiene datos sobre vinos rojos.

En el código de abajo, se hace lo siguiente:

1. Usar la función _genfromtxt_ para leer los datos del archivo _winequality-red.csv_.
2. Especificar el argumento _delimiter=";"_ para separar los campos correctamente.
3. Especificar el argumento _skip_header=1_ para brincar la primera fila (las etiquetas de los campos).

NumPy automaticamente escogerá un tipo de dato para los elementos en el arreglo, basado en su formato.

In [0]:
import numpy as np

vinos = np.genfromtxt("winequality-red.csv", delimiter=";", skip_header=1)

vinos

# Uso de Numpy para Guardar Archivos .csv

También podemos guardar arreglos Numpy en archivos .csv
Veremos cómo guardar arreglos Numpy de 1D y 2D en archivos .csv, con y sin encabezados y notas de pié.

__numpy.savetxt()__

El módulo de Numpy provee una función para guardar arreglos Numpy a un archvo de texto con delimitadores y otras opciones "adhoc" i.e.

__numpy.savetxt(fname, arr, fmt='%.18e', delimiter=' ', newline='\n', header='', footer='', comments='# ', encoding=None)__

### Argumentos:
- __arr__ : arrego Numpy 1D o 2D (a ser gurdado)
- __fmt__ : Un patron de formato, o secuemcias de formatos, que se usarán para guardar elementos en el archivo.
    - Si se usa un formateador único como ‘%d’ entonces será aplicado a todos los elementos.
    - En el caso de arregos 2D una lista especificadora i.e. diferente para cada columna. (Optional)
- __delimiter__ : Cadena o caracter a ser utilizado como separador de elementos (Optional)
- __newline__ : Cadena o caracter a usarse como separador de líneas (Optional)
- __header__ : Cadena a ser escrita al inicio del archivo de texto.
- __footer__ : Cadena a ser escrita al final del archivode texto.
- __comments__ : Marcador "adhoc" de comentarios, el default es ‘#’. Será puesto como prefijo al header y footer.

Utilicemos esto para guardar arreglos Numpy 1D y 2D en un archivo csv.

## Guardar un arreglo Numpy a un archivo CSV utilizando numpy.savetxt()
Recuerde que el módulo numpy debe haber sido importado antes



In [0]:
# Crear un arreglo Numpy 1D a partir de una lista de números
arreglo = np.array([6, 1, 4, 2, 18, 9, 3, 4, 2, 8, 11])
print('Arreglo Original: ', arreglo)

In [0]:
# Guardar arreglo Numpy en archivo csv
np.savetxt('arreglo.csv', [arreglo], delimiter=',', fmt='%d')

Se usó el delimitador ‘,’ para hacerlo en formato csv. También se pasó la cadena de formato ‘%d’, para que guarde los elementos como integer. El default es almacenar números en formato float. También debe notarse que si no se encierra el arreglo numpy por estos [ ] i.e. convertirlo a una lista para pasarlo a numpy.savetxt(), entoces el delimitador de coma no funcionará, ya que utilizará el delimitador ‘\n’ por default. Así que envolver el arreglo por [ ] es obligatorio i.e. [arr].

## Guardar un arreglo Numpy 1D en un archivo csv con Header (Encabezado) y Footer (Nota de Pié)

Si se desea agregar comentarios al encabezado y a la nota de pié, al guardar el archivo .csv, se pueden usar los parámetros header y footer i.e.

In [0]:
# Guardar arreglo Numpy a csv con encabezado y nota de pié
np.savetxt('arreglo_ep.csv', [arreglo], delimiter=',', fmt='%d' , header='Ejemplo de arreglo Numpy 2D :: Encabezado', footer='Esta es la nota de pié')

Por default los commentarios en ambos header y footer serán precedidos por ‘#’. Si se quiere cambiar esto, se puede pasar el parámetro comments de esta forma comments=’@’

## Guardar un arreglo Numpy 2D a un archivo CSV

In [0]:
# Crear a arreglo Numpy 2D lista de listas
arreglo2D = np.array([[11, 12, 13, 22], [21, 7, 23, 14], [31, 10, 33, 7]])
print('Arreglo Numpy 2D')
print(arreglo2D)

# Guardar arreglo Numpy 2D en un archivo csv
np.savetxt('arreglo2D.csv', arreglo2D, delimiter=',', fmt='%d')

También, en vez de guardar un arreglo Numpy 2D completo, si queremos podemos guardar solo una, o múltiples, columnas o filas.

## Guardar una columna de un arreglo Numpy 2D a un archivo cvs

In [0]:
# Guardar la 2nda columna de un arreglo Numpy 2D a un archivo csv
np.savetxt('arreglo2D_columna.csv', [arreglo2D[:,1]], delimiter=',', fmt='%d')

## Guardar una fila de un arreglo Numpy 2D en un archivo csv

In [0]:
# Guardar la 2nda fila de un arreglo Numpy 2D a un archivo csv
np.savetxt('arreglo2D_fila.csv', [arreglo2D[1] ], delimiter=',', fmt='%d')

## Guardar un archivo Numpy estructurado en un archivo csv utilizando una lista de opciones de formato

Crearémos un arreglo numpy estructurado en el que cada elemento en el arreglo contenga un string, float e integer i.e.

In [0]:
# Crear el tipo de la estructura
tipo_dato = [('Nombre', (np.str_, 10)), ('Notas', np.float64), ('Grado', np.int32)]

# Crear un arreglo Numpy estructurado
arreglo_estructurado = np.array([('Pedro', 33.3, 3), ('Maria', 44.4, 5), ('Juan', 66.6, 6), ('Rosa', 88.8, 7)], dtype=tipo_dato)
print(arreglo_estructurado)

# Guardar arreglo Numpy estructurado en archivo csv
np.savetxt('arreglo_estructurado.csv', arreglo_estructurado, delimiter=',', fmt=['%s' , '%f', '%d'], header='Nombre,Notas,Grado', comments='')