# 1. Archivos CSV

Este notebook presenta un módulo que admite la generación de archivos CSV (o valores separados por comas).

El formato CSV (valores separados por comas) es el formato de importación y exportación más común para hojas de cálculo y bases de datos. Sin embargo, CSV no es un estándar preciso con múltiples aplicaciones diferentes que tienen diferentes convenciones y estándares específicos.


El módulo Python `csv` implementa clases para leer y escribir datos tabulares en formato CSV. Como parte de esto, admite el concepto de dialecto, que es un formato CSV utilizado por una aplicación o conjunto de programas específicos; por ejemplo, admite un dialecto de Excel.


Esto permite a los programadores decir, "escribir estos datos en el formato preferido por Excel", o "leer datos de este archivo que fue generado por Excel", sin conocer los detalles precisos del formato CSV utilizado por Excel.

Los programadores también pueden describir los dialectos CSV entendidos por otras aplicaciones o definir sus propios dialectos CSV para propósitos especiales.

El módulo `csv` proporciona una variedad de funciones que incluyen:

* `csv.reader (csvfile, dialect = 'excel', ** fmtparams)` Devuelve un objeto lector que iterará sobre las líneas del archivo `csv` dado. Se puede dar un parámetro de dialecto opcional. Puede ser una instancia de una subclase de la clase Dialect o una de las cadenas devueltas por la función list_dialects (). Los otros argumentos opcionales de la palabra clave fmtparams se pueden proporcionar para anular los parámetros de formato individuales en el dialecto actual.

* `csv.writer (csvfile, dialect = 'excel', ** fmtparams)` Devuelve un objeto escritor responsable de convertir los datos del usuario en cadenas delimitadas en el archivo `csv` dado. Se proporciona un parámetro de dialecto opcional. Los argumentos de la palabra clave fmtparams se pueden dar para anular los parámetros de formato individuales en el dialecto actual.

* `csv.list_dialects ()` Devuelve los nombres de todos los dialectos registrados. Por ejemplo, en Mac OS X, la lista predeterminada de dialectos es \['excel', 'excel-tab', 'unix'\].


# 2. La clase `write` de  CSV 

Un escritor CSV se obtiene de la función `csv.writer()`. El `csvwriter` admite dos métodos utilizados para escribir datos en el archivo CSV:

* `csvwriter.writerow(row)` Escribe el parámetro de fila en el objeto de archivo del escritor, formateado de acuerdo con el dialecto actual.
* `csvwriter.writerows(row) Escribe todos los elementos en filas (un iterable de objetos de fila como se describe anteriormente) en el objeto de archivo del escritor, formateado de acuerdo con el dialecto actual.
* Los objetos Writer también tienen el siguiente atributo público:
* `csvwriter.dialect` Una descripción de solo lectura del dialecto que usa el escritor.

El siguiente programa ilustra un uso simple del módulo csv que crea un archivo llamado `sample.csv`.

Como no hemos especificado un dialecto, se utilizará el dialecto "excel" predeterminado. El método `writerow()` se utiliza para escribir cada lista de cadenas separada por comas en el archivo CSV.

In [1]:
import csv

In [2]:
print('Crearting CSV file')
with open('sample.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['She Loves You', 'Sept 1963']) 
    writer.writerow(['I Want to Hold Your Hand', 'Dec 1963']) 
    writer.writerow(['Cant Buy Me Love', 'Apr 1964']) 
    writer.writerow(['A Hard Days Night', 'July 1964'])


Crearting CSV file


In [3]:
a = input("Metan sus datos:" )

Metan sus datos:20


# La clase de `reader` CSV

Un objeto de CSV Reader se obtiene de la función `csv.reader().` Implementa el protocolo de iteración.

Si se utiliza un objeto lector de csv con un bucle `for`, cada vez que se recorre el bucle, se proporciona la siguiente fila del archivo CSV como una lista, analizada de acuerdo con el dialecto CSV actual.

Los objetos de lector también tienen los siguientes atributos públicos:

* `csvreader.dialect` Una descripción de solo lectura del dialecto que usa el analizador.

* `csvreader.line_num` El número de líneas leídas desde el iterador de origen. No es lo mismo que el número de registros devueltos, ya que los registros pueden abarcar varias líneas.

A continuación, se proporciona un ejemplo muy simple de lectura de un archivo CSV utilizando un objeto lector de csv:

In [6]:
print('Starting to read csv file')
with open('sample.csv', newline='') as csvfile:
    reader = csv.reader(csvfile) 
    for row in reader:
        print(*row, sep=', ') 
print('Done Reading')


Starting to read csv file
She Loves You, Sept 1963
I Want to Hold Your Hand, Dec 1963
Cant Buy Me Love, Apr 1964
A Hard Days Night, July 1964
Done Reading


# 3. La clase CSV `DictWriter`

En muchos casos, la primera fila de un archivo CSV contiene un conjunto de nombres (o claves) que definen los campos dentro del resto del CSV. Esa es la primera fila que da significado a las columnas y los datos contenidos en el resto del archivo CSV. Por lo tanto, es muy útil capturar esta información y estructurar los datos escritos en un archivo CSV o cargados desde un archivo CSV según las claves de la primera fila.

El `csv.DictWriter` devuelve un objeto que se puede utilizar para escribir valores en el archivo CSV según el uso de dichas columnas con nombre. El archivo que se utilizará con `DictWriter` se proporciona cuando se crea una instancia de la clase.

In [7]:
with open('names.csv', 'w', newline='') as csvfile: 
    fieldnames = ['first_name', 'last_name', 'result'] 
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerow({'first_name': 'John','last_name': 'Smith','result' : 54}) 
    writer.writerow({'first_name': 'Jane', 'last_name': 'Lewis','result': 63}) 
    writer.writerow({'first_name': 'Chris', 'last_name': 'Davies','result' : 72})


Tenga en cuenta que cuando se crea el `DictWriter`, se debe proporcionar una lista de las claves que se utilizan para las columnas en el archivo CSV.

El método `writeheader()` se usa para escribir la fila del encabezado en el archivo CSV.

El método `writerow()` toma un objeto de diccionario que tiene claves basadas en las claves definidas para `DictWriter`. Luego, estos se utilizan para escribir datos en el CSV (tenga en cuenta que el orden de las claves en el diccionario no es importante).

En el código de ejemplo anterior, el resultado de esto es que se crea un nuevo archivo llamado `names.csv` que se puede abrir en Excel:

Por supuesto, como se trata de un archivo CSV, también se puede abrir en un editor de texto sin formato.

# 4 La clase CSV `DictReader` 

Además del `csv.DictWriter`, hay un `csv.DictReader`. El archivo que se utilizará con `DictReader` se proporciona cuando se crea una instancia de la clase. Al igual que con `DictReader`, la clase `DictWriter` toma una lista de claves utilizadas para definir las columnas en el archivo CSV. Si se pueden proporcionar los encabezados que se utilizarán para la primera fila, aunque esto es opcional (si no se proporciona un conjunto de claves, los valores de la primera fila del archivo CSV se utilizarán como nombres de campo).

La clase `DictReader` proporciona varias características útiles, incluida la propiedad de nombres de campo que contiene una lista de las claves / encabezados para el archivo CSV como se define en la primera fila del archivo.

La clase `DictReader` también implementa el protocolo de iteración y, por lo tanto, puede usarse en un bucle for en el que cada fila (después de la primera fila) se devuelve a su vez como un diccionario. El objeto de diccionario que representa cada fila se puede utilizar para acceder a cada valor de columna según las claves definidas en la primera fila.

A continuación, se muestra un ejemplo para el archivo CSV creado anteriormente:

In [8]:
with open('names.csv', newline='') as csvfile:
    reader = csv.DictReader(csvfile)
    for heading in reader.fieldnames:
        print(heading, end=' ')
    print('\n------------------------------')
    
    for row in reader:
        print(row['first_name'], row['last_name'],row['result']) 
print('Done')

first_name last_name result 
------------------------------
John Smith 54
Jane Lewis 63
Chris Davies 72
Done


# 5 Trabajar con archivos de Excel

En esta seción se presenta el módulo `openpyxl` que se puede utilizar cuando se trabaja con archivos de Excel. Excel es una aplicación de software desarrollada por Microsoft que permite a los usuarios trabajar con hojas de cálculo. Es una herramienta muy utilizada y los archivos que utilizan el formato de archivo Excel se encuentran comúnmente en muchas organizaciones. De hecho, es el estándar de la industria para hojas de cálculo y, como tal, es una herramienta muy útil para tener en la caja de herramientas de los desarrolladores.

# 6 Archivos Excel

Aunque los archivos CSV son una forma cómoda y sencilla de manejar datos; es muy común necesitar poder leer o escribir archivos de Excel directamente. Con este fin, hay varias bibliotecas disponibles en Python para este propósito. Una biblioteca ampliamente utilizada es la biblioteca ***OpenPyXL***. Esta biblioteca se escribió originalmente para admitir el acceso a archivos de Excel 2010. Es un proyecto de código abierto y está bien documentado.

* leer y escribir libros de Excel,
* crear / acceder a hojas de cálculo de Excel,
* creando fórmulas de Excel,
* creación de gráficos (con el apoyo de módulos adicionales).

La biblioteca `OpenPyXL` proporciona facilidades para leer y escribir libros de Excel, crear / acceder a hojas de cálculo de Excelleer y escribir libros de Excel, crear / acceder a hojas de cálculo de Excel,
creando fórmulas de Excel,creación de gráficos (con el apoyo de módulos adicionales).

Como OpenPyXL no es parte de la distribución estándar de Python, deberá instalar la biblioteca usted mismo usando una herramienta como Anaconda o pip (por ejemplo, pip install openpyxl). Alternativamente, si está utilizando PyCharm, podrá agregar la biblioteca OpenPyXL a su proyecto.

# 7.  La clase `Openpyxl.Workbook` 

El elemento clave de la biblioteca `OpenPyXL` es la clase `Workbook`. Esto se puede importar desde el módulo:

In [1]:
from openpyxl import Workbook

Se puede crear una nueva instancia del Libro de trabajo (en memoria) utilizando la clase Libro de trabajo (tenga en cuenta que en este punto es puramente una estructura dentro del programa Python y debe guardarse antes de crear un archivo de Excel real).

In [9]:
?Workbook

In [49]:
wb = Workbook()

In [50]:
print(wb)

<openpyxl.workbook.workbook.Workbook object at 0x113b3c828>


# 8 Los objetos `Openpyxl.WorkSheet` 

Un libro de trabajo siempre se crea con al menos una hoja de trabajo. Puede obtener la hoja de trabajo actualmente activa utilizando la propiedad `Workbook.active`:

In [51]:
ws = wb.active

In [52]:
print(ws)

<Worksheet "Sheet">


Se puede crear hojas de trabajo adicionales utilizando el método `create_sheet()` de los libros de trabajo:

In [53]:
ws = wb.create_sheet('Mysheet')

Puede acceder o actualizar el título de la hoja de trabajo usando el método `title`:

In [54]:
ws.title = 'New Title'

El color de fondo de la pestaña que contiene este título es blanco por defecto. Puede cambiar esto proporcionando un atributo de código de color RRGGBB a la hoja de trabajo `worksheet`.  `sheet_properties.tabColor`, por ejemplo:

In [55]:
ws.sheet_properties.tabColor = "1072BA"

# 9 Trabajar con la celdas 

Es posible acceder a las celdas dentro de una hoja de trabajo. Se puede acceder a una celda directamente como claves en la hoja de trabajo, por ejemplo:

In [56]:
ws['A1'] = 42

o

In [57]:
cell = ws['A1']

Esto devuelve un objeto de celda; puede obtener el valor de la celda usando la propiedad value, por ejemplo

In [58]:
print(cell)

<Cell 'New Title'.A1>


In [59]:
print(cell.value)

42


También existe el método `Worksheet.cell()`. Esto proporciona acceso a las celdas usando la notación de filas y columnas:

In [60]:
d = ws.cell(row=4, column=2, value=10)

In [61]:
print(d)

<Cell 'New Title'.B4>


También se puede agregar una fila de valores en la posición actual dentro del archivo de Excel usando agregar:

In [62]:
ws.append([1, 2, 3])

In [35]:
ws.values

<generator object values at 0x113bd93b8>

Esto agregará una fila al archivo de Excel que contiene 1, 2 y 3. Se puede acceder a los rangos de celdas usando la división:

In [63]:
cell_range = ws['A1':'B2']

In [64]:
cell_range

((<Cell 'New Title'.A1>, <Cell 'New Title'.B1>),
 (<Cell 'New Title'.A2>, <Cell 'New Title'.B2>))

También se pueden obtener rangos de filas o columnas:

In [65]:
col = ws['C'] 
col_range = ws['C:D'] 
row10 = ws[10] 
row_range = ws[5:10]

El valor de una celda también puede ser una fórmula de Excel como

In [66]:
ws['A3'] = '=SUM(A1, A2)'

Un libro de trabajo es en realidad solo una estructura en la memoria; debe guardarse en un archivo para almacenamiento permanente. Estos libros de trabajo se pueden guardar usando el método `save()`. Este método toma un nombre de archivo y escribe el `Workbook` en formato Excel.

In [67]:
wb.save('balances.xlsx')

```python
workbook = Workbook()
... 
workbook.save('balances.xlsx')
```

# 10 Ejemplo de aplicación de creación de archivos de Excel 

La siguiente aplicación simple crea un libro de trabajo con dos hojas de trabajo. También contiene una fórmula simple de Excel que suma los valores retenidos en otras celdas:

In [47]:
def main():
    print('Starting Write Excel Example with openPyXL')
    workbook = Workbook()
    
    # Get the current active worksheet
    ws = workbook.active
    ws.title = 'my worksheet' 
    ws.sheet_properties.tabColor = '1072BA'
    
    ws['A1'] = 42
    ws['A2'] = 12
    ws['A3'] = '=SUM(A1, A2)'
    
    ws2 = workbook.create_sheet(title='my other sheet') 
    ws2['A1'] = 3.42
    ws2.append([1, 2, 3])
    ws2.cell(column=2, row=1, value=15)
    workbook.save('sample.xlsx')
    
    print('Done Write Excel Example')

In [69]:
main()

Starting Write Excel Example with openPyXL
Done Write Excel Example


In [48]:
if __name__ == '__main__': main()

Starting Write Excel Example with openPyXL
Done Write Excel Example


# Cargar un `Workbook` desde un archivo de Excel 

Por supuesto, en muchos casos es necesario no solo crear archivos Excel para exportar datos, sino también importar datos desde un archivo Excel existente. Esto se puede hacer usando la función `load_workbook()` de OpenPyXL. Esta función abre el archivo de Excel especificado (en modo de solo lectura de forma predeterminada) y devuelve un objeto `Workbook`.

In [70]:
from openpyxl import load_workbook

In [71]:
workbook = load_workbook(filename='sample.xlsx')

Ahora se puede acceder a una lista de hojas, sus nombres, obtener la hoja actualmente activa, etc. utilizando las propiedades proporcionadas por el objeto `workbook`:

* `workbook.active` devuelve el objeto de hoja de trabajo activo.
* `workbook.sheetnames` devuelve los nombres (cadenas) de las hojas de trabajo de este libro.
* `workbook.worksheets` devuelve una lista de objetos de la hoja de trabajo.

La siguiente aplicación de muestra lee el archivo de Excel creado anteriormente en esta sección:

In [74]:
def main():
    print('Starting reading Excel file using openPyXL')
    
    workbook = load_workbook(filename='sample.xlsx') 
    print(workbook.active)
    print(workbook.sheetnames) 
    print(workbook.worksheets)
    
    print('-' * 10)
    
    ws = workbook['my other sheet'] 
    print(ws['A1']) 
    print(ws['A1'].value) 
    print(ws['A2'].value) 
    print(ws['A3'].value)
    
    print('-' * 10)
    for sheet in workbook:
        print(sheet.title)
        
    print('-' * 10) 
    cell_range = ws['A1':'A3'] 
    for cell in cell_range:
        print(cell[0].value) 
    print('-' * 10)
    
    print('Finished reading Excel file using openPyXL')

In [75]:
if __name__ == '__main__':
    main()


Starting reading Excel file using openPyXL
<Worksheet "my worksheet">
['my worksheet', 'my other sheet']
[<Worksheet "my worksheet">, <Worksheet "my other sheet">]
----------
<Cell 'my other sheet'.A1>
3.42
1
None
----------
my worksheet
my other sheet
----------
3.42
1
None
----------
Finished reading Excel file using openPyXL
