# Cargar Datos en Python

0. Manualmente cargando un fichero.
1. Usando `np.loadtxt`
2. Usando `np.genfromtxt`
3. Usando `pd.read_csv`
4. Usando `pickle`

In [None]:
import numpy as np
import pickle
import pandas as pd
filename = "load.csv"

Intenta y nunca cargues manualmente un archivo.

![Locura](https://pavlov.psyciencia.com/2014/03/locura.jpeg)

In [None]:
cols = None
data = []
with open(filename) as f:
    for line in f.readlines():
        vals = line.replace("\n", "").split(",")
        if cols is None:
            cols = vals
        else:
            data.append([float(x) for x in vals])
d0 = pd.DataFrame(data, columns=cols)
print("="*20)
print("El tipo de las columnas son: ")
print(d0.dtypes)
print("="*20)
d0.head()

### np.loadtxt

In [None]:
d1 = np.loadtxt(filename, skiprows=1, delimiter=",")
print(d1.dtype)
print(d1[:5, :])

### np.genfromtxt

In [None]:
d2 = np.genfromtxt(filename, delimiter=",", names=True, dtype=None)
print(d2.dtype)
print(d2[:5])

### pandas.read_csv

Con diferencia, el mejor y más flexible lector de archivos CSV/txt. Muy, muy recomendable. 
[Documentación](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html).

In [None]:
d3 = pd.read_csv(filename)
print(d3.dtypes)
d3.head()

### pickle

Para cuando los datos u objetos no son una buena matriz 2D y son más difíciles de guardar como algo legible por personas. Hay que tener en cuenta que si solo tiene un 3D, 4D... ND vectores todos del mismo tipo, también se puede usar `np.save`  el cual guardará una matriz numpy arbitraria en formato binario. Súper rápido para guardar, súper rápido para cargar y tamaño de archivo pequeño.

Pickle es para todo lo que es más complicado. Puede guardar diccionarios, matrices e incluso objetos.

In [None]:
with open("load_pickle.pickle", "rb") as f:
    d4 = pickle.load(f)
print(d4.dtypes)
d4.head()