# **Introducción a Python**
# FP28. Capstone 1
## Trabajando con archivos CSV

¡Bienvenido Agente! Analicemos cómo trabajar con archivos CSV (**Comma Separeted Values**) en Python. Un archivo con la extensión de archivo CSV es un archivo de valores separados por comas. Todos los archivos CSV son de texto sin formato, contienen caracteres alfanuméricos y estructuran los datos contenidos en ellos en forma tabular. No confunda los archivos de Excel con los archivos csv, mientras que los archivos csv tienen un formato muy similar al de los archivos de Excel, no tienen tipos de datos para sus valores, todos son cadenas sin fuente ni color. Tampoco tienen hojas de trabajo como lo hace un archivo de Excel. Python tiene varias bibliotecas para trabajar con archivos de Excel, puede consultarlas [aquí](http://www.python-excel.org/) y [aquí](https://www.xlwings.org/).

Los archivos en formato CSV se utilizan generalmente para intercambiar datos, generalmente cuando hay una gran cantidad, entre diferentes aplicaciones. Los programas de bases de datos, el software analítico y otras aplicaciones que almacenan cantidades masivas de información (como contactos y datos de clientes), generalmente admitirán el formato CSV.

Exploremos cómo podemos abrir un archivo csv con la biblioteca csv incorporada de Python.

## <font color='green'>Misión</font>

Has conseguido acceso a un archivo clasificado de agentes.
Tu misión consiste en lo siguiente:<br>
1. Abrir el archivo
2. Leer el archivo
3. Interpreta qué tipo de información tiene el archivo
4. Extrae los emails del archivo
5. Extrae los nombres reales completos
6. Escribe en un archivo csv nuevo

## <font color='green'>Actividad 1:</font> Abrir archivo CSV

Nombre del archivo: *agentes.csv*

TIP:

1. Utiliza la sentencia  `with open()`
```python
with open(nombre archivo) ...
```
2. Utiliza la librería `cvs`; investiga su uso

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# Investigacion Libreria CSV

La librería `csv` en Python se utiliza para trabajar con archivos CSV (Comma-Separated Values),
que son un formato común para almacenar datos tabulares.
A continuación, información sobre cómo usar la librería `csv` en Python:

La librería `csv` es parte de la biblioteca estándar de Python,
por lo que no es necesario instalarla por separado.
Puedes usarla importándola en tu código:

import csv

cómo realizar algunas operaciones comunes utilizando la librería `csv`:

1. **Lectura de archivos CSV:**

   Puedes abrir y leer un archivo CSV de la siguiente manera:


    with open('archivo.csv', 'r') as archivo_csv:
       lector_csv = csv.reader(archivo_csv)
       for fila in lector_csv:
           print(fila)

   Esto abrirá el archivo CSV llamado "archivo.csv" y lo leerá fila por fila.

2. **Escritura en archivos CSV:**

   Puedes crear y escribir en un archivo CSV de la siguiente manera:

   datos = [
       ["Nombre", "Edad"],
       ["Juan", 25],
       ["María", 30],
       ["Carlos", 22]
   ]

    with open('nuevo_archivo.csv', 'w', newline='') as archivo_csv:
        escritor_csv = csv.writer(archivo_csv)
        escritor_csv.writerows(datos)


   Esto creará un nuevo archivo CSV llamado "nuevo_archivo.csv" y escribirá los datos en él.

Documentacion Oficial

https://docs.python.org/es/3/library/csv.html

'''

In [None]:
import csv


with open('/content/drive/MyDrive/Colab Notebooks/Diplomado Ciencia de Datos UDD/01 Fundamentos de Python/Archivos Con Cambios/Archivos/example.csv') as data:
  print(data)

## <font color='green'>Actividad 2:</font> Leer archivo CSV y verificar codificación

Confirma que *agentes.csv* se abrió correctamente. Lee el archivo y verifica si está bien codificado. En algunos entornos de Python, los archivos csv pueden contener caracteres que no pueden interpretarse correctamente; los símbolos `@`, o incluso caracteres con tildes pueden producir esto.

TIP:

1. Para leer utiliza la función `reader` de la libreria `csv`
2. Si la lectura tuvo problemas, vuelve al abrir el archivo con `encoding='utf-8'`. Utiliza la función
```python
with open(nombre archivo, encoding="utf-8") ...
```
3. Investiga en interner más sobre cómo leer archivos cvs en Python
4. Imprime la primera y tercera línea del archivo

In [None]:
# Tu código aquí ...
with open('/content/drive/MyDrive/Colab Notebooks/Diplomado Ciencia de Datos UDD/01 Fundamentos de Python/Archivos Con Cambios/Archivos/example.csv') as data:
  # print(data)
  csv_data = csv.reader(data)
  data_lines = list(csv_data)
  print(data_lines[0], '\n')
  print(data_lines[2])


Ten en cuenta que el primer elemento de la lista es la línea de encabezado, la cual contiene la información sobre lo que representa cada columna.

## <font color='green'>Actividad 3:</font> Qué información tiene el archivo?

Lee las tres primeras líneas e imprímelas para verificar qué tipo de información tiene el archivo.

1. Cuántos campos tiene cada registro?
2. Cuantos regitros tiene el archivo?

In [None]:
# Tu código aquí...

with open('/content/drive/MyDrive/Colab Notebooks/Diplomado Ciencia de Datos UDD/01 Fundamentos de Python/Archivos Con Cambios/Archivos/example.csv') as data:
    csv_data = csv.reader(data)
    data_lines = list(csv_data)
    for linea in data_lines[:3]:
        print(linea, end='\n\n')
    campos = len(data_lines[0])
    print(f'Cada registro tiene {campos} campos\n')
    registros = len(data_lines) - 1
    print(f'El archivo tiene {registros} registros')

## <font color='green'>Actividad 4:</font> Extrae los emails si existen?

1. Extrae los 20 primeros emails de los registros; si es que existen, por supuesto!!<br>
2. Guárdalos en una lista y comprueba que sean 20.
3. Imprímelos hacia abajo desde la lista .

In [None]:
# Tu código aquí ...

emails = []

with open('/content/drive/MyDrive/Colab Notebooks/Diplomado Ciencia de Datos UDD/01 Fundamentos de Python/Archivos Con Cambios/Archivos/example.csv') as data:

    csv_data = csv.reader(data)
    data_lines = list(csv_data)
    for linea in data_lines[1:21]:
        emails.append(linea[3])

print(f'Se extaen los primeros {len(emails)} mails\n')
for email in emails:
    print(f'{email}')


## <font color='green'>Actividad 5:</font> Extrae los nombres reales completos

1. Extrae los 20 primeros nombres completos **de mujeres** de los registros.
2. Guárdalos en una lista y comprueba que sean 20.
3. Imprímelos desde la lista ordenada ascendente.

In [None]:
# Tu código aquí ...

nombres = []
cont = 0
with open('/content/drive/MyDrive/Colab Notebooks/Diplomado Ciencia de Datos UDD/01 Fundamentos de Python/Archivos Con Cambios/Archivos/example.csv') as data:
    csv_data = csv.reader(data)
    data_lines = list(csv_data)
    for linea in data_lines:
        if linea[4] == 'Female':
            nombres.append(f'{linea[1]} {linea[2]}')
            cont += 1
            if cont == 20:
                break

nombres.sort()

print(f'Se extaen los primeros {len(nombres)} nombres')
print('Orden ascendente\n')
for nombre in nombres:
    print(f'{nombre}')

## <font color='green'>Actividad 6:</font> Escribe en un archivo csv nuevo

Toma los nombres de la Tarea 5 y escríbelos en un archivo *cvs*. Llama al archivo *agentes_vigilar*

Tips:
1. Abre un archivo nuevo en modo escritura (modo `w`).
2. Escribe en él desde la lista de la Tarea 5, utilizando un ciclo `for` y el método `writerow` de la librería `csv`.
3. Verifica la correcta escritura: abre el archivo y lee su contenido.


In [None]:
# Tu código aquí ...

out_file = '/content/drive/MyDrive/Colab Notebooks/Diplomado Ciencia de Datos UDD/01 Fundamentos de Python/Archivos Con Cambios/Archivos/agentes_vigilar.csv'
with open(out_file, mode='w') as csv_out:
    csv_writer = csv.writer(csv_out,  delimiter=',')
    for linea in nombres:
        csv_writer.writerow([linea])

in_file = '/content/drive/MyDrive/Colab Notebooks/Diplomado Ciencia de Datos UDD/01 Fundamentos de Python/Archivos Con Cambios/Archivos/agentes_vigilar.csv'
with open(in_file) as data:
    csv_reader = csv.reader(data, delimiter=',')
    dl = list(csv_reader)

    for nombre in dl:
        print(f'{nombre[0]}')

En Python se trabaja con archivos CSV con frecuencia. Más adelante trabajarás con la poderosa biblioteca [`pandas`](https://pandas.pydata.org/) y en ella es frecuente su uso.