# Lectura de un fichero csv

Vamos a ver distintas formas de abrir un fichero csv utilizando Python.

Conocimientos previos de Python recomendables:

  - [Tipos y variables](../python/tipos_y_variables.ipynb)
  - [Cadenas de texto](../python/cadenas_de_texto.ipynb)
  - [Booleanos](../python/booleanos.ipynb)
  - [Control de flujo](../python/control_de_flujo.ipynb)
  - [Bloques e indentación](../python/bloques_e_indentacion.ipynb)
  - [Listas y secuencias](../python/secuencias.ipynb)
  - [Diccionarios](../python/diccionarios.ipynb)
  - [Ficheros](../python/ficheros.ipynb)
  - [Modulos](python/modulos.ipynb)

Conocimientos previos de análisis de datos en Python recomendables:

  - [Herramientas](../analisis/herramientas.ipynb)
  - [Numpy](../analisis/numpy.ipynb)
  - [Pandas](../analisis/pandas.ipynb)


# Leyendo un fichero

In [10]:
from pathlib import Path

path = Path('/home/jose/devel/covid_practice/cache/2021-3-23-casos_hosp_uci_def_sexo_edad_provres.csv')
fhand = path.open('rt')

sep = ','
fields = None
records = []
for line in fhand:
    items = line.strip().split(sep)

    if fields is None:
        fields = items
        continue
        
    record = dict(zip(fields, items))
    records.append(record)

print(len(records))
first_record = records[0]
print(first_record)
print(first_record['grupo_edad'])

702780
{'provincia_iso': 'A', 'sexo': 'H', 'grupo_edad': '0-9', 'fecha': '2020-01-01', 'num_casos': '0', 'num_hosp': '0', 'num_uci': '0', 'num_def': '0'}
0-9


# Leyendo un fichero usando el módulo csv

In [14]:
from pathlib import Path
import csv

path = Path('/home/jose/devel/covid_practice/cache/2021-3-23-casos_hosp_uci_def_sexo_edad_provres.csv')
fhand = path.open('rt')

sep = ','
reader = csv.DictReader(fhand, delimiter=sep)
print(reader.fieldnames)
records = list(reader)
print(len(records))
first_record = records[0]
print(first_record)
print(first_record['grupo_edad'])

['provincia_iso', 'sexo', 'grupo_edad', 'fecha', 'num_casos', 'num_hosp', 'num_uci', 'num_def']
702780
{'provincia_iso': 'A', 'sexo': 'H', 'grupo_edad': '0-9', 'fecha': '2020-01-01', 'num_casos': '0', 'num_hosp': '0', 'num_uci': '0', 'num_def': '0'}
0-9


# Leyendo un fichero utilizando pandas

In [15]:
from pathlib import Path
import pandas

path = Path('/home/jose/devel/covid_practice/cache/2021-3-23-casos_hosp_uci_def_sexo_edad_provres.csv')
sep = ','
dframe = pandas.read_csv(path, delimiter=',')
print(dframe)

       provincia_iso sexo grupo_edad       fecha  num_casos  num_hosp  \
0                  A    H        0-9  2020-01-01          0         0   
1                  A    H      10-19  2020-01-01          0         0   
2                  A    H      20-29  2020-01-01          0         0   
3                  A    H      30-39  2020-01-01          0         0   
4                  A    H      40-49  2020-01-01          0         0   
...              ...  ...        ...         ...        ...       ...   
702775            ZA   NC      50-59  2021-03-17          0         0   
702776            ZA   NC      60-69  2021-03-17          0         0   
702777            ZA   NC      70-79  2021-03-17          0         0   
702778            ZA   NC        80+  2021-03-17          0         0   
702779            ZA   NC         NC  2021-03-17          0         0   

        num_uci  num_def  
0             0        0  
1             0        0  
2             0        0  
3             0