# Lectura de un fichero csv

Vamos a ver distintas formas de abrir un fichero csv utilizando Python.

Conocimientos previos de Python recomendables:

  - [Tipos y variables](../python/tipos_y_variables.ipynb)
  - [Cadenas de texto](../python/cadenas_de_texto.ipynb)
  - [Booleanos](../python/booleanos.ipynb)
  - [Control de flujo](../python/control_de_flujo.ipynb)
  - [Bloques e indentación](../python/bloques_e_indentacion.ipynb)
  - [Listas y secuencias](../python/secuencias.ipynb)
  - [Diccionarios](../python/diccionarios.ipynb)
  - [Ficheros](../python/ficheros.ipynb)
  - [Modulos](python/modulos.ipynb)

Conocimientos previos de análisis de datos en Python recomendables:

  - [Herramientas](../analisis/herramientas.ipynb)
  - [Numpy](../analisis/numpy.ipynb)
  - [Pandas](../analisis/pandas.ipynb)


# Descargar un fichero

In [None]:
import requests
from pathlib import Path

# get the data
url = 'https://cnecovid.isciii.es/covid19/resources/casos_hosp_uci_def_sexo_edad_provres.csv'

# path in which we will download the data
data_dir = Path('..') / 'downloaded_data'
data_dir.resolve()
data_dir.mkdir(exist_ok=True)

fname = url.split('/')[-1]
covid_csv_path = data_dir / fname

if not covid_csv_path.exists():
    # download the data
    response = requests.get(url)
    # check everything went fine
    assert response.ok

    # save the data in a file
    fhand = open(covid_csv_path, 'wb')
    fhand.write(response.content)
    fhand.close()


# Leyendo un fichero

In [None]:
from pathlib import Path

covid_csv_path = Path('..') / 'downloaded_data' / 'casos_hosp_uci_def_sexo_edad_provres.csv'

fhand = covid_csv_path.open('rt')

sep = ','
fields = None
records = []
for line in fhand:
    items = line.strip().split(sep)

    if fields is None:
        fields = items
        continue
        
    record = dict(zip(fields, items))
    records.append(record)

print(len(records))
first_record = records[0]
print(first_record)
print(first_record['grupo_edad'])

# Leyendo un fichero usando el módulo csv

In [None]:
from pathlib import Path
import csv

covid_csv_path = Path('..') / 'downloaded_data' / 'casos_hosp_uci_def_sexo_edad_provres.csv'
fhand = covid_csv_path.open('rt')

sep = ','
reader = csv.DictReader(fhand, delimiter=sep)
print(reader.fieldnames)
records = list(reader)
print(len(records))
first_record = records[0]
print(first_record)
print(first_record['grupo_edad'])

# Leyendo un fichero utilizando pandas

In [None]:
from pathlib import Path
import pandas

covid_csv_path = Path('..') / 'downloaded_data' / 'casos_hosp_uci_def_sexo_edad_provres.csv'
dframe = pandas.read_csv(covid_csv_path, delimiter=',', parse_dates=['fecha'], index_col='fecha')
print(dframe)

Con pandas incluso se puede cargar el csv directamente desde la web.

In [None]:
import pandas

url = 'https://cnecovid.isciii.es/covid19/resources/casos_hosp_uci_def_sexo_edad_provres.csv'
dframe = pandas.read_csv(url, delimiter=',', parse_dates=['fecha'], index_col='fecha')
print(dframe.shape)
dframe