## La librería csv

La librería **`csv`** permite trabajar de forma fácil con ficheros
de tipo :CSV (*Comma Separated Values* o Valores separados por comas) 

El formato de fichero llamado CSV (*Comma Separated Values* o
Valores separados por comas) es uno de los más habitualmente usados
para el intercambio de información de hojas de cálculo o bases de
datos.

A pesar de eso, no hay ningún estandar (o hay muchos) ni norma escrita, así
que el formato esta definido de forma más o menosinformal por
el conjunto de aplicaciones que pueden leerlo o escribirlo.

![Standards](../img/xkcd-standards.png)
Original en <https://xkcd.com/927/>

Esta carencia de estandares provoca que haya multiples, variadas y
pequeñas diferencias entre los datos producidos o consumidos por
diferentes aplicaciones. Por esta razón, trabajar con distinto
ficheros CSV provinientes de distintas fuentes suele dar más de un
dolor de cabeza. 

A pesar de estas divergencias (empezando por que
caracter usar como separador de campos), es posible escribir un módulo
que pueda maniputar de forma eficiente estos datos, ocultado al
programador los detalles específicos de leer o escribir estos
ficheros,

El módulo csv permite escribir y leer estos archivos. El programador
puede especificar, por ejemplo, "escribe este archivo en el formato
preferido por excel", o "lee este fichero como fuera de excel, pero
usando el carácter `:` como separador de campos". También nos
permite definir nuestros propios formatos de uso particular, que el
módulo denomina "dialectos".

In [2]:
id, f_inicio, activo, nombre, ciudad
123, 2020-12-23, S, "Juanito", "La laguna"
123, 2020-12-23, N, "Fulanito", "Las Palmas"
...
123, 2020-12-23, N, "Menganito, el hijo de \"Zutanita\"", Icod

NameError: name 'f_inicio' is not defined

### Contenido de este módulo

Las dos funciones más usadas dentro de este módulo son `reader` y `writer`, usadas
obviamente para leer y escribir desde un fichero csv. 

Las dos funciones aceptan como primer argumento un fichero abierto (o algo que se comporte
de forma parecida, basicamente que tega un método `read` para leer y un `write` para
escribir). Si trabajamos con ficheros, estos deben estar abiertos de la forma adecuada,
es decir, 'r' para leer, 'w' o 'a' para escribir.

- La funcion `reader`

Esta función nos devuelve un iterador, que irá devolviendo las distintas líneas del
fichero. Las linea han sido procesadas, de forma que ya todos los problemas que nos
podriamos encontrar están resueltos; los campos están separados, los campos que
vengan entrecomillados has sido procesados y nos llegan como esperamos, etc.

In [26]:
num = 24
if num % 2 == 0:
    print("Par")
else:
    print("Impar")

Par


In [30]:
for num in range(1, 12):
    print(num, "par" if num % 2 == 0 else "Impar")

1 Impar
2 par
3 Impar
4 par
5 Impar
6 par
7 Impar
8 par
9 Impar
10 par
11 Impar


In [2]:
!head marvel-wikia-data.csv

673702,Yologarch (Earth-616),\/Yologarch_(Earth-616),,Bad Characters,,,,,Living Characters,,,l Characters,,,Male Characters,,Living Characters,,,cters,,,ters,,,aracters,,,al Characters,Living Characters,,,acters,,Mar-13,2013ers,,Oct-08,20088,2008979,Edward Lansky (Earth-616),\/Edward_Lansky_(Earth-616),Public Identity,Neutral Characters,Brown Eyes,Brown Hair,Male Characters,,Living Characters,30,Dec-76,1976,13,Jul-66,1966ariable Hair,,,Living Characters,5,Jun-61,1961ers,,Living Characters,3,Jan-08,2008ers,,Deceased Characters,1,Sep-43,1943cters,,Living Characters,1,Feb-03,2003

In [1]:
import csv

with open('marvel-wikia-data.csv', 'r') as f:
    reader = csv.reader(f)
    for i, row in enumerate(reader):
        print(row)
        if i > 10:
            break

['page_id', 'name', 'urlslug', 'ID', 'ALIGN', 'EYE', 'HAIR', 'SEX', 'GSM', 'ALIVE', 'APPEARANCES', 'FIRST APPEARANCE', 'Year']
['1678', 'Spider-Man (Peter Parker)', '\\/Spider-Man_(Peter_Parker)', 'Secret Identity', 'Good Characters', 'Hazel Eyes', 'Brown Hair', 'Male Characters', '', 'Living Characters', '4043', 'Aug-62', '1962']
['7139', 'Captain America (Steven Rogers)', '\\/Captain_America_(Steven_Rogers)', 'Public Identity', 'Good Characters', 'Blue Eyes', 'White Hair', 'Male Characters', '', 'Living Characters', '3360', 'Mar-41', '1941']
['64786', 'Wolverine (James \\"Logan\\" Howlett)', '\\/Wolverine_(James_%22Logan%22_Howlett)', 'Public Identity', 'Neutral Characters', 'Blue Eyes', 'Black Hair', 'Male Characters', '', 'Living Characters', '3061', 'Oct-74', '1974']
['1868', 'Iron Man (Anthony \\"Tony\\" Stark)', '\\/Iron_Man_(Anthony_%22Tony%22_Stark)', 'Public Identity', 'Good Characters', 'Blue Eyes', 'Black Hair', 'Male Characters', '', 'Living Characters', '2961', 'Mar-63', 

In [31]:
import csv

csv.register_dialect('marvel', delimiter=',', quoting=csv.QUOTE_NONE, escapechar="\\")

filename = "../../files/marvel-wikia-data.csv"
with open(filename, 'r') as f:
    reader = csv.reader(f, dialect="marvel")
    next(reader)  # Ignorar la primera linea
    for i, row in enumerate(reader):
        year = int(row[-1] if row[-1] else 0)
        if 1972 <= year <= 1974:
            print(row[1], year)
        if i == 24:
            break
            

"Wolverine (James ""Logan"" Howlett)" 1974


In [7]:
!head ../../files/marvel-wikia-data.csv

page_id,name,urlslug,ID,ALIGN,EYE,HAIR,SEX,GSM,ALIVE,APPEARANCES,FIRST APPEARANCE,Year
1678,Spider-Man (Peter Parker),\/Spider-Man_(Peter_Parker),Secret Identity,Good Characters,Hazel Eyes,Brown Hair,Male Characters,,Living Characters,4043,Aug-62,1962
7139,Captain America (Steven Rogers),\/Captain_America_(Steven_Rogers),Public Identity,Good Characters,Blue Eyes,White Hair,Male Characters,,Living Characters,3360,Mar-41,1941
64786,"Wolverine (James \""Logan\"" Howlett)",\/Wolverine_(James_%22Logan%22_Howlett),Public Identity,Neutral Characters,Blue Eyes,Black Hair,Male Characters,,Living Characters,3061,Oct-74,1974
1868,"Iron Man (Anthony \""Tony\"" Stark)",\/Iron_Man_(Anthony_%22Tony%22_Stark),Public Identity,Good Characters,Blue Eyes,Black Hair,Male Characters,,Living Characters,2961,Mar-63,1963
2460,Thor (Thor Odinson),\/Thor_(Thor_Odinson),No Dual Identity,Good Characters,Blue Eyes,Blond Hair,Male Characters,,Living Characters,2258,Nov-50,1950
2458,Benjamin Grimm (Earth-616),\/Benja

**Ejercicio**: Usar el fichero del ejemplo anterior y listar todos los personajes de
    marvel creados en la decada de los 70 (De 1971 a 1980)

In [6]:
!head ../files/marvel-wikia-data.csv

673702,Yologarch (Earth-616),\/Yologarch_(Earth-616),,Bad Characters,,,,,Living Characters,,,l Characters,,,Male Characters,,Living Characters,,,cters,,,ters,,,aracters,,,al Characters,Living Characters,,,acters,,Mar-13,2013ers,,Oct-08,20088,2008979Blue Eyes,Blond Hair,Female Characters,,Living Characters,14,Jul-79,1979(Earth-616),Public Identity,,,,Male Characters,,Living Characters,6,Jun-95,1995 Brushov (Earth-616),\/Yuri_Brushov_(Earth-616),No Dual Identity,Bad Characters,,Brown Hair,Male Characters,,Living Characters,3,Aug-67,19678e (Earth-616),\/Doctor_Luville_(Earth-616),Public Identity,Bad Characters,,Black Hair,Male Characters,,Deceased Characters,1,Sep-44,1944-75,1975Living Characters,1,Jan-00,2000ov-92,1992

La funcion `writer` se usa de forma similar,a hora con un fichero abierto para escribir:

Y uno de escritura:

In [33]:
import csv
datos = [
    ('Leonardo', 'Azul', 1452),
    ('Raphael', 'Rojo', 1483),
    ('Michelangelo', 'Naranja', 1475),
    ('Donatello', 'Violeta', 1386),
    ]
with open('ninja-turtles.csv', 'w') as f:
    writer = csv.writer(f)
    writer.writerows(datos)

In [34]:
!cat ninja-turtles.csv

Leonardo,Azul,1452
Raphael,Rojo,1483
Michelangelo,Naranja,1475
Donatello,Violeta,1386


**Ejercicio**: El fichero anterior estaria mejor si tuviera una primera fila con
los nombres de las columnas (p.e. `name`, `colour`, `year`). Modificar el código
para incluir este primera fila