<a href="https://colab.research.google.com/github/al34n1x/DataScience/blob/master/1.Intro/7.Operando_con_Archivos_CSV.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Archivo CSV
Los archivos CSV normalmente son creados por programas que manejan grandes cantidades de datos. Son una forma conveniente de exportar datos de hojas de cálculo y bases de datos, así como de importarlos o usarlos en otros programas. Por ejemplo, puede exportar los resultados de un programa de minería de datos a un archivo CSV y luego importarlo a una hoja de cálculo para analizar los datos, generar gráficos para una presentación o preparar un informe para su publicación.

Es muy fácil trabajar con archivos CSV mediante programación. Cualquier lenguaje que admita la entrada de archivos de texto y la manipulación de cadenas (como Python) puede funcionar con archivos CSV directamente.

## Librería CSV

La biblioteca csv proporciona funcionalidad para leer y escribir en archivos CSV. Diseñado para funcionar desde el primer momento con archivos CSV generados por Excel, se adapta fácilmente para trabajar con una variedad de formatos CSV. La biblioteca csv contiene objetos y otro código para leer, escribir y procesar datos desde y hacia archivos CSV.

## Lectura CSV
La lectura de un archivo CSV se realiza mediante el objeto lector. El archivo CSV se abre como un archivo de texto con la función open () incorporada de Python, que devuelve un objeto de archivo. Esto luego se pasa al lector, que hace el trabajo pesado.

Aquí está el archivo employee_birthday.txt: (Una vez creado, renombrarlo a **employee_birthday.csv** )

```
name,department,birthday_month
Pepe,dev,nov
```

In [3]:
import csv

with open('./sample_data/employee_birthday.csv') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    line_count = 0
    for row in csv_reader:
        if line_count == 0:
            print(f'Column names are {", ".join(row)}') #El método join () es un método de cadena y devuelve una cadena en la que los elementos de la secuencia se han unido mediante un separador str.
            line_count += 1
        else:
            print(f'\t{row[0]} works in the {row[1]} department, and was born in {row[2]}.')
            line_count += 1
    print(f'Processed {line_count} lines.')


Column names are 'name', 'department', 'birthday month'
	Ale works in the  dev department, and was born in  nov.
Processed 2 lines.


## Lectura CSV como Diccionario


En lugar de tratar con una lista de elementos String individuales, también puede leer datos CSV directamente en un diccionario (técnicamente, un Diccionario ordenado).

Nuevamente, nuestro archivo de entrada, employee_birthday.txt es el siguiente:

```
name,department,birthday_month
Pepe,dev,nov
```

In [7]:
import csv

with open('./sample_data/employee_birthday.csv', mode='r') as csv_file:
    csv_reader = csv.DictReader(csv_file)
    line_count = 0
    for row in csv_reader:
        print(row)
        if line_count == 0:
            print(f'Column names are {", ".join(row)}')
            line_count += 1
        print(f'\t{row["name"]} works in the {row["department"]} department, and was born in {row["birthday_month"]}.')
        line_count += 1
    print(f'Processed {line_count} lines.')


OrderedDict([('name', 'Ale'), ('department', ' dev'), ('birthday_month', ' nov')])
Column names are name, department, birthday_month
	Ale works in the  dev department, and was born in  nov.
Processed 2 lines.


<csv.DictReader at 0x7f4e41478d50>

## Escribiendo archivos CSV

También puede escribir en un archivo CSV usando un objeto de escritura y el método .write_row ().
El parámetro opcional quotechar le dice al escritor qué carácter usar para citar campos al escribir. Sin embargo, si se utiliza la cotización o no, se determina mediante el parámetro opcional de cotización:

* Si se establece csv.QUOTE_MINIMAL, entonces .writerow () citará los campos solo si contienen el delimitador o el carácter de cotización. Este es el caso predeterminado.
* Si se establece csv.QUOTE_ALL, entonces .writerow () citará todos los campos.
* Si se establece csv.QUOTE_NONNUMERIC, entonces .writerow () citará todos los campos que contienen datos de texto y convertirá todos los campos numéricos al tipo de datos flotantes.
* Si se establece csv.QUOTE_NONE, entonces .writerow () escapará de los delimitadores en lugar de citarlos. En este caso, también debe proporcionar un valor para el parámetro opcional escapechar.



In [9]:
import csv

with open('./sample_data/employee_birthday.csv', mode='w') as employee_file:
    employee_writer = csv.writer(employee_file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
    employee_writer.writerow(['name', 'department', 'birthday month'])
    employee_writer.writerow(['John Smith', 'Accounting', 'November'])
    employee_writer.writerow(['Erica Meyers', 'IT', 'March'])


## Escribir un archivo CSV desde un diccionario con csv

Dado que puede leer nuestros datos en un diccionario, es justo que también pueda escribirlos desde un diccionario.
A diferencia de DictReader, el parámetro fieldnames es obligatorio al escribir un diccionario. Esto tiene sentido, cuando lo piensa: sin una lista de nombres de campo, el DictWriter no puede saber qué claves usar para recuperar valores de sus diccionarios. También usa las claves en los nombres de campo para escribir la primera fila como nombres de columna.

In [10]:
import csv

with open('./sample_data/employee_file2.csv', mode='w') as csv_file:
    fieldnames = ['emp_name', 'dept', 'birth_month']
    writer = csv.DictWriter(csv_file, fieldnames=fieldnames)

    writer.writeheader()
    writer.writerow({'emp_name': 'John Smith', 'dept': 'Accounting', 'birth_month': 'November'})
    writer.writerow({'emp_name': 'Erica Meyers', 'dept': 'IT', 'birth_month': 'March'})
