# **Introducción a Python**
# FP28. Capstone 1
## Trabajando con archivos CSV

¡Bienvenido Agente! Analicemos cómo trabajar con archivos CSV (**Comma Separeted Values**) en Python. Un archivo con la extensión de archivo CSV es un archivo de valores separados por comas. Todos los archivos CSV son de texto sin formato, contienen caracteres alfanuméricos y estructuran los datos contenidos en ellos en forma tabular. No confunda los archivos de Excel con los archivos csv, mientras que los archivos csv tienen un formato muy similar al de los archivos de Excel, no tienen tipos de datos para sus valores, todos son cadenas sin fuente ni color. Tampoco tienen hojas de trabajo como lo hace un archivo de Excel. Python tiene varias bibliotecas para trabajar con archivos de Excel, puede consultarlas [aquí](http://www.python-excel.org/) y [aquí](https://www.xlwings.org/).

Los archivos en formato CSV se utilizan generalmente para intercambiar datos, generalmente cuando hay una gran cantidad, entre diferentes aplicaciones. Los programas de bases de datos, el software analítico y otras aplicaciones que almacenan cantidades masivas de información (como contactos y datos de clientes), generalmente admitirán el formato CSV.

Exploremos cómo podemos abrir un archivo csv con la biblioteca csv incorporada de Python.

## <font color='green'>Misión</font>

Has conseguido acceso a un archivo clasificado de agentes.
Tu misión consiste en lo siguiente:<br>
1. Abrir el archivo
2. Leer el archivo
3. Interpreta qué tipo de información tiene el archivo
4. Extrae los emails del archivo
5. Extrae los nombres reales completos
6. Escribe en un archivo csv nuevo

## <font color='green'>Actividad 1:</font> Abrir archivo CSV

Nombre del archivo: *agentes.csv*

TIP:

1. Utiliza la sentencia  `with open()`
```python
with open(nombre archivo) ...
```
2. Utiliza la librería `cvs`; investiga su uso

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [4]:
# Tu código aquí ...
import csv

with open('/content/drive/MyDrive/BITACORA - Grupo 3/FUNDAMENTOS DE PYTHON/assets/agentes.csv') as file:
    # Leer el archivo usando csv.reader
    csv_reader = csv.reader(file)

    print("Contenido del archivo:")
    for row in csv_reader:
        print(row)

Contenido del archivo:
['Alvera Jepp']
['Benedetta Glanert']
['Charyl Halstead']
['Danita Aldrin']
['Dyana Howatt']
['Elmira Goodhand']
['Felicdad Tarr']
['Freida Drillingcourt']
['Gillie Roantree']
['Hetty Lightollers']
['Honey Crenshaw']
['Isa Boycott']
['Jeanelle VanBrugh']
['Julianne Murrison']
['Kassey Herion']
['Lucy Gamet']
['Merralee Lampel']
['Nanni Herity']
['Nariko Clunie']
['Sarina Choulerton']


## <font color='green'>Actividad 2:</font> Leer archivo CSV y verificar codificación

Confirma que *agentes.csv* se abrió correctamente. Lee el archivo y verifica si está bien codificado. En algunos entornos de Python, los archivos csv pueden contener caracteres que no pueden interpretarse correctamente; los símbolos `@`, o incluso caracteres con tildes pueden producir esto.

TIP:

1. Para leer utiliza la función `reader` de la libreria `csv`
2. Si la lectura tuvo problemas, vuelve al abrir el archivo con `encoding='utf-8'`. Utiliza la función
```python
with open(nombre archivo, encoding="utf-8") ...
```
3. Investiga en interner más sobre cómo leer archivos cvs en Python
4. Imprime la primera y tercera línea del archivo

In [7]:
# Tu código aquí ...
with open('/content/drive/MyDrive/BITACORA - Grupo 3/FUNDAMENTOS DE PYTHON/assets/agentes.csv', encoding='utf-8') as file:
    csv_reader = csv.reader(file)

    # Convertir el reader a una lista para acceder fácilmente a las líneas
    lines = list(csv_reader)

    # Imprimir la primera y tercera línea (recuerda que los índices comienzan en 0)
    print("La primera línea:", lines[0])
    print("La tercera línea:", lines[2])


La primera línea: ['Alvera Jepp']
La tercera línea: ['Charyl Halstead']


Ten en cuenta que el primer elemento de la lista es la línea de encabezado, la cual contiene la información sobre lo que representa cada columna.

## <font color='green'>Actividad 3:</font> Qué información tiene el archivo?

Lee las tres primeras líneas e imprímelas para verificar qué tipo de información tiene el archivo.

1. Cuántos campos tiene cada registro?
2. Cuantos regitros tiene el archivo?

In [13]:
# Tu código aquí...
# Contar el número de campos en la primera línea (asumiendo que la primera línea es el encabezado)

print("Las tres primeras líneas:")
for line in lines[:3]:
    print(line)

if lines:
    num_fields = len(lines[0])  # Número de campos en el encabezado
    print(f"Número de campos en cada registro: {num_fields}")

# Contar el número total de registros
total_records = len(lines)  # Total de registros
print(f"Número total de registros en el archivo: {total_records}")



Las tres primeras líneas:
['Alvera Jepp']
['Benedetta Glanert']
['Charyl Halstead']
Número de campos en cada registro: 1
Número total de registros en el archivo: 3


## <font color='green'>Actividad 4:</font> Extrae los emails si existen?

1. Extrae los 20 primeros emails de los registros; si es que existen, por supuesto!!<br>
2. Guárdalos en una lista y comprueba que sean 20.
3. Imprímelos hacia abajo desde la lista .

In [None]:
# Abrir el archivo CSV y extraer los correos electrónicos
# Como vimos al visualizar la primera y tercera línea, no existen

## <font color='green'>Actividad 5:</font> Extrae los nombres reales completos

1. Extrae los 20 primeros nombres completos **de mujeres** de los registros.
2. Guárdalos en una lista y comprueba que sean 20.
3. Imprímelos desde la lista ordenada ascendente.

In [19]:
# Tu código aquí ...
#Asumiremos que todos los nombres son de mujeres, ya que no hay una variable que lo específique
# Lista para almacenar los nombres completos de mujeres
# Lista para almacenar los nombres completos
nombres_m = []

# Abrir el archivo CSV y extraer los nombres completos
with open('/content/drive/MyDrive/BITACORA - Grupo 3/FUNDAMENTOS DE PYTHON/assets/agentes.csv', encoding='utf-8') as file:
    csv_reader = csv.reader(file)

    # Extraer los primeros 20 nombres completos
    for row in csv_reader:
        if len(nombres_m) < 20:
            nombres_m.append(row[0])  # pude ver que es la única información en el archivo
        else:
            break

# Ordenar la lista de nombres en orden ascendente
nombres_m.sort()

# Comprobar que haya 20 nombres
if len(nombres_m) == 20:
    print("Se han extraído 20 nombres completos:")
else:
    print(f"Se han extraído {len(nombres_m)} nombres completos.")

# Imprimir los nombres completos
for name in nombres_m:
    print(name)


Se han extraído 20 nombres completos:
Alvera Jepp
Benedetta Glanert
Charyl Halstead
Danita Aldrin
Dyana Howatt
Elmira Goodhand
Felicdad Tarr
Freida Drillingcourt
Gillie Roantree
Hetty Lightollers
Honey Crenshaw
Isa Boycott
Jeanelle VanBrugh
Julianne Murrison
Kassey Herion
Lucy Gamet
Merralee Lampel
Nanni Herity
Nariko Clunie
Sarina Choulerton


## <font color='green'>Actividad 6:</font> Escribe en un archivo csv nuevo

Toma los nombres de la Tarea 5 y escríbelos en un archivo *cvs*. Llama al archivo *agentes_vigilar*

Tips:
1. Abre un archivo nuevo en modo escritura (modo `w`).
2. Escribe en él desde la lista de la Tarea 5, utilizando un ciclo `for` y el método `writerow` de la librería `csv`.
3. Verifica la correcta escritura: abre el archivo y lee su contenido.


In [20]:
# Tu código aquí ...
nombres_m = [
    "Alvera Jepp", "Benedetta Glanert", "Charyl Halstead", "Danita Aldrin",
    "Dyana Howatt", "Elmira Goodhand", "Felicdad Tarr", "Freida Drillingcourt",
    "Gillie Roantree", "Hetty Lightollers", "Honey Crenshaw", "Isa Boycott",
    "Jeanelle VanBrugh", "Julianne Murrison", "Kassey Herion", "Lucy Gamet",
    "Merralee Lampel", "Nanni Herity", "Nariko Clunie", "Sarina Choulerton"
]

# Nombre del archivo CSV de salida
obj_salida = 'agentes_vigilar.csv'

# Abrir el archivo en modo escritura
with open(obj_salida, mode='w', encoding='utf-8', newline='') as file:
    csv_writer = csv.writer(file)

    # Escribir cada nombre en una fila del archivo CSV
    for nombre in nombres_m:
        csv_writer.writerow([nombre])

# Verificar la correcta escritura leyendo el archivo
with open(obj_salida, mode='r', encoding='utf-8') as file:
    csv_reader = csv.reader(file)

    # Leer y mostrar el contenido del archivo
    for row in csv_reader:
        print(row)


['Alvera Jepp']
['Benedetta Glanert']
['Charyl Halstead']
['Danita Aldrin']
['Dyana Howatt']
['Elmira Goodhand']
['Felicdad Tarr']
['Freida Drillingcourt']
['Gillie Roantree']
['Hetty Lightollers']
['Honey Crenshaw']
['Isa Boycott']
['Jeanelle VanBrugh']
['Julianne Murrison']
['Kassey Herion']
['Lucy Gamet']
['Merralee Lampel']
['Nanni Herity']
['Nariko Clunie']
['Sarina Choulerton']


En Python se trabaja con archivos CSV con frecuencia. Más adelante trabajarás con la poderosa biblioteca [`pandas`](https://pandas.pydata.org/) y en ella es frecuente su uso.