# ¡Desafío técnico! Clientes y pedidos: ¡el alma de cualquier negocio!

Este cuaderno depende de dos archivos de datos: customer.scv y orders.csv. Estos archivos están alojados en la nube (o Github), por lo que, para simplificar, le proporcionamos el código para descargar y guardar los dos archivos en una carpeta llamada 'sample_data' que se encuentra dentro de esta sesión de notebook (no en su computadora local ni Google Drive).

![sample_data folder in notebook session](https://raw.githubusercontent.com/fpellerano/itu/main/sample_data_folder.png)

Ejecute el primer fragmento de código antes de pasar al resto del ejercicio, ya que este código importará los datos de los archivos para que pueda ejecutar el resto del ejercicio.

Recuerde, como dijimos en la lección anterior, debe guardar este cuaderno en su Google Drive yendo al menú Archivo/Guardar una copia en Drive, o haciendo clic en el botón "Copiar a Drive". De esta manera, no perderá ningún trabajo que haya realizado y el archivo persistirá con los últimos cambios en su Google Drive. También le recomendamos que cambie el nombre de su .ipynb en su Google Drive, para que pueda encontrarlo fácilmente en el futuro.

In [3]:
import requests

def import_data_files():
  r = requests.get('https://raw.githubusercontent.com/fpellerano/itu/main/customers.csv')
  with open('./sample_data/customers.csv', 'wb') as f:
    f.write(r.content)
  r = requests.get('https://raw.githubusercontent.com/fpellerano/itu/main/customers_and_orders/data/orders.csv')
  with open('./sample_data/orders.csv', 'wb') as f:
    f.write(r.content)

import_data_files()
print("Customers and orders CSV files have been added './sample_data'")

Customers and orders CSV files have been added './sample_data'


# Ejercicio 1: Procesamiento de Datos de Clientes (dificultad media)

Los datos de muestra de clientes en el archivo 'customers.csv' tienen solo 5 columnas: CustomerId, First Name, Last Name, City y State.

![Muestra de datos](https://raw.githubusercontent.com/fpellerano/itu/main/customers.png)

Recomendamos encarecidamente que completes la práctia previa:
- Sección 7: Entrada/Salida de Archivos (para entender cómo leer un archivo CSV)
- Sección 6: Bucle For (para navegar por el contenido del archivo CSV)
- Sección 5: Tuplas, Listas y Diccionarios (para manipular los datos del archivo CSV)

Con esto, esperamos que puedas completar con éxito este ejercicio. Sin embargo, si deseas resolverlo utilizando bibliotecas u otro método, siéntete libre de hacerlo a tu manera.

*Pista:* Te recomendamos que eches un vistazo a los datos antes de comenzar.
**Si deseas ver los datos manualmente antes de comenzar, consulta el contenido de los datos [aquí](https://raw.githubusercontent.com/fpellerano/itu/main/customers.csv).

*Pista:* Hay muchas maneras de resolver este ejercicio, y puedes hacerlo tú mismo, pero aquí te ofrecemos algo de ayuda. Puedes resolver este ejercicio leyendo y analizando archivos CSV, estructurando datos en diccionarios y usando bucles for para navegar por los contenidos.

*Sugerencia:* Además, ten en cuenta que los datos pueden no estar limpios, y deberás descubrir cómo manejarlos desde el código sin modificar la fuente de datos.

A continuación, se presentan las 5 preguntas que deberás responder para aprobar la evaluación:

**Pregunta 1:** ¿Cuántos clientes hay en el expediente?
(como ayuda, hemos agregado algunos comentarios y un código de inicio para ayudarlo a estructurar la solución)

In [5]:
from os.path import exists
import csv

# comprobar si se puede encontrar el archivo y abrirlo
datafile = "./sample_data/customers.csv"
if not exists(datafile):
  raise SystemExit("You should run the first code cell and download the dataset files!")

# archivo de clientes (customer.csv) está en la carpeta sample_data y se puede abrir.
# Usar el lector csv es una forma de manejar el archivo
# pero depende de ti cómo quieres proceder
with open(datafile, 'r') as fl:
  csvreader = csv.reader(fl, delimiter=',')

# recorra las filas y cuente, etc. ¡EL RESTO DEPENDE DE USTED!


print("All done!")

All done!


**Pregunta 2:** ¿En cuántos estados diferentes viven los clientes?

In [6]:
# abrir archivo e iniciar vars
# evaluar el contenido del archivo

**Pregunta 3** ¿Cuál es el estado con más clientes?

In [7]:
# abrir archivo e iniciar vars
# evaluar el contenido del archivo

**Pregunta 4** ¿Cuál es el estado con menos clientes?

In [8]:
# abrir archivo e iniciar vars
# evaluar el contenido del archivo

Pregunta 5: ¿Cuál es el apellido más común?

In [9]:
# abrir archivo e iniciar vars
# evaluar el contenido del archivo


# Ejercicio 2: Procesamiento de datos de Órdenes (dificultad media)

El segundo archivo de muestra contiene pedidos realizados por clientes del primer archivo. Tenga cuidado, este archivo tiene muchas filas y lo más probable es que no deba imprimir el contenido de todo el archivo.

El archivo contiene las siguientes columnas: CustomerID, OrderID, Date, OrderTotal, ProductName, Price

![Data sample](https://raw.githubusercontent.com/fpellerano/itu/main/orders.png)

*Pista:* Te aconsejamos que eches un vistazo a los datos antes de empezar.
**si desea ver los datos manualmente antes de comenzar, consulte el contenido de los datos [aquí](https://raw.githubusercontent.com/fpellerano/itu/main/orders.csv).

*Pista*: Hay muchas maneras de hacer este ejercicio y puedes hacerlo tú mismo, aunque aquí te ofrecemos algo de ayuda. Puede resolver este ejercicio leyendo y analizando archivos CSV, estructurando datos en diccionarios y usando bucles for para navegar por los contenidos.

*Sugerencia*: Además, los datos no están limpios y tendrás que descubrir cómo manejarlos desde el código, sin tener que modificar la fuente de datos.



**Pregunta n.º 1:** ¿Cuántos pedidos únicos hay en el archivo pedidos.csv?

**Pregunta n.º 2:** ¿Cuál es el número promedio de artículos por pedido (redondeado a dos decimales)?

**Pregunta #3:** ¿Cuál es la mayor cantidad de artículos por pedido?

**Pregunta #4:** ¿Cuál es la cantidad de pedidos realizados en octubre de 2021?

**Pregunta n.º 5:** ¿Qué cliente gastó la mayor cantidad de dinero en 2021?

**Pregunta n.º 6:** Históricamente, ¿cuál es el mejor mes para las ventas?

Una vez que tengas tus respuestas, recuerda volver al curso y presentarlas en el cuestionario de opción múltiple.

In [10]:
# abrir y evaluar orders.csv

# ¡Finalizado!

Espero que esto no haya sido demasiado difícil y que dividir y dividir los conjuntos de datos haya sido divertido.