# Sprint 4 - Manipulación de Datos II (Sesiones)
**Versión para estudiantes**

En este caso de estudio se busca continuar con la práctica de los fundamentos de manipulación de datos con **Pandas**, así como una primera aproximación hacía la visualización de resultados mediante gráficos con **Matplotlib**. 

## Entendimiento del contexto

La industria del turismo es aquella que se enfoca en traer personas a destinos específicos localizados en zonas geográficas que ofrezcan características escénicas, culturales o naturales altamente demandadas. Esta actividad puede clasificarse en turismo receptivo o emisivo. El primero de estos se enfoca en establecer productos o servicios propios en dichas zonas y buscar clientes alrededor del mundo para ocupar los espacios provistos; por su parte el segundo se especializa en llevar turistas a destinos fuera de sus lugares habituales de residencia, generando un cíclo económico virtuoso.

Visto esto, Metropolitan Touring (en adelante, MT) se constituye en el principal operador de turismo receptivo en Ecuador, Colombia y Perú, teniendo como principal destino a las islas Galápagos cuya fama radica en su valor único en cuanto a diversidad y especialidad biológica y botánica. En consecuencia, la empresa oferta cruceros en aproximadamene 150 salidas anuales de 4 y 6 noches, a las cuales acompaña con la venta de tickets aéreos para conectar a los turistas con los aeropuertos insulares, y otros servicios complementarios como transfers, visitas guiadas y alojamientos para quienes estén interesados.       

Entre los principales canales del venta de MT destacan mayoristas de turismo emisivo y agencias de viaje. Los mayoristas pueden ser de 3 tipos: 

* Charters: Empresas que compran la totalidad de los espacios disponibles en algunas salidas para su posterior reventa.
* FIT: Empresas que se especializan en la reventa a grupos de turistas bajo demanda bajo el esquema *One-Size Fits All*.
* Grupos: Empresas que se especializan en la reventa a grupos de turistas preprogramados (i.e Empresas que mantienen beneficios para sus empleados).

La empresa desea ejecutar análisis estratégicos semanales y mensuales para tomar decisiones en las unidades comercial y de marketing, por lo cual te ha pedido apoyo para la preparación de su información.

## Entendimiento de los datos

Ante todo, recuerda cargar las librerías que utilizarás en este documento. Importa por tanto **Pandas**, **Numpy** y **Matplotlib**. 

Sobre esta última vale mencionar que la misma provee de funcioens y métodos para la ejecución de visualizaciones mediante gráficos.

MT ha compartido contigo información de sus ventas en el año 2023 para los canales de venta y productos referidos en el apartado anterior. Estos datos están disponibles en el dataset **ventas2023.txt**.

Carga el dataset verificando el tipo y separador de este archivo.

Esta table cuenta con 754 registros y 6 columnas descritas a continuación:

* fecha: Fecha en la que se realizó el viaje.
* canal: Tipo de cliente al cual se le vendió uno o más servicios.
* tickets_aereos: Valor de venta en miles de USD por concepto de tickets aéreos.
* barco_1: Valor de venta en miles de USD por concepto de salidas de cruceros en itinerario de 4 noches.
* barco_2: Valor de venta en miles de USD por concepto de salidas de cruceros en itinerario de 6 noches.
* otros_servicios: Valor de venta en miles de USD por concepto de otros servicios menores.

Explora el dataset con el propósito de generar un plan de acción para preparar los datos.

**PLAN DE ACCION PARA PREPARACIÓN DE DATOS**

<Aquí tu respuesta>

## Preparación de datos

Cambia el tipo de variable de la columna fecha.

Extrae los componentes de mes, dia de la semana y semana a partir de la columna fecha.

Tanto el mes como el día de la semana, poseen una representación más semántica. En concreto para el caso de mes, 1 representa Enero, 2 es Febrero, etc. Utiliza el método `merge` para hacer que la columna mes sea más semántica. Apóyate con el siguiente dataset auxiliar:

```py
cat_mes = pd.DataFrame({
    'mes':list(range(1,13)),
    'mes_n':['01.Ene','02.Feb','03.Mar','04.Abr','05.May','06.Jun','07.Jul','08.Ago','09.Sep','10.Oct','11.Nov','12.Dic']
})
```

Ahora utiliza el método `apply` para hacer que la columna dia_semana sea más semántica. Considera que el día 0 corresponde al Lunes.

Cambia los valores de la columna canal por Charter, FIT, Grupos o Agencias según corresponda. Emplea el método `apply`.

Imputa el valor de 0 a los valores ausentes de todas las columnas que representen ventas.

Transforma los valores de la columnas de venta de miles de USD a USD.

Genera las columnas venta_barcos, venta_otros y venta_total que consoliden las ventas por estos servicios según corresponda.

¡Listo! el dataset se encuentra limpio para iniciar la etapa de análisis. Concluye finalmente reorganizando la tabla de tal manera que:

* Se excluyan las columnas de tickets_aereos, barco_1, barco_2 y otros_servicios.
* Se reordenen las columnas tal que este sea el orden: canal, fecha, mes, semana, dia_semana, venta_total, venta_barcos, ventas_otros.

## Análisis de datos

Recuerda que para un correcto análisis vale que tengas siempre en cuenta lo siguiente:

* Su propósito fundamental es **responder preguntas de negocio**, por lo que siempre debes buscar dar rsoluciones concretas en base a tus resultados.
* No se limita a realizar gráficos o tablas resumen, sino a generar **conclusiones** que aporten valor a partir de estas visualizaciones.
* Debe mantener un **hilo de ideas** conductor lo cual implica orden y consistencia entre los resultados.

En consecuencia, las unidades comerciales y de marketing de MT te plantean las siguientes preguntas:

### ¿Cuál ha sido el comportamiento semanal de las ventas totales?

Para realizar una correcta visualización que responda una pregunta de negocio conviene que sigas estos pasos:

1. Agrega adecuadamente los datos definiendo una métrica o indicador relevante, las variables de agrupamiento y los filtros pertinentes.
2. Evalúa si el resultado de la agregación a modo de tabla es suficiente para responder la pregunta de negocio o un gráfico resultaría más conveniente y "visual".
3. Si según tu criterio, un gráfico ayúda más a responder la pregunta, créalo de forma simple sin preocuparte por ahora de los aspectos formales del mismo.
4. Genera las conclusiones correspondientes.
5. Regresa al gráfico o tabla creado y aplica los aspectos formales que consideres pertinentes. Si vas a realizar gráficos y deseas dominar el poder detrás de las visualizaciones con **matplotlib**, te sugiero mirar las galerias de muestra en el link https://matplotlib.org/stable/gallery/index.html.   

Agrega entonces los datos de una forma pertinente. Recuerda usar métodos como `groupby` o `pivot_table`. 

Si bien la tabla obtenida muestra los resultados deseados, existe mucha información en el sentido que hay 52 semanas, lo cual dificulta la interpretación acerca del comportamiento de ventas. Entonces, vale que realices un gráfico mediante el método `plot`.

Proporciona al menos una conclusión relevante.

**CONCLUSIONES**

<Aquí tu respuesta>

Finalmente repite el gráfico con los aspectos formales que estimes necesarios.

### ¿Cuál es la venta promedio de barcos cada día de la semana?

Sigue los mismos pasos de la pregunta anterior para dar una respuesta satisfactoria.

In [None]:
# Agregar los datos


In [None]:
# Crear gráfico simple


**CONCLUSIONES**

<Aquí tu respuesta>

In [None]:
# Crear gráfico con formato


### ¿Cómo se comportan las ventas por canal?

In [None]:
# Ejecutar todos los pasos de agregación y visualización recomendados

**CONCLUSIONES**

<Aquí tu respuesta>

## Entendimiento de nuevos datos

Vistos los buenos resultados alcanzados hasta el momento por tu análisis, MT te provee de nueva información constante en el dataset **paxtours2023.xlsx**.

Carga esta tabla en tu documento considerando que su extensión es *xlsx*.

El dataframe consta de 48 filas y 4 columnas descritas a continuación:

* canal: Tipo de cliente asociado a la ventas del 2023.
* mes: Mes del 2023 en el cual se hizo el viaje.
* pax: Cantidad de pasajeros que correponden a ese canal y mes de venta.
* tours: Cantidad de grupos que correponden a ese canal y mes de venta.

Estudia este dataset y define un plan de acción para procesarlo y posteriormente unirlo satisfactoriamente con la información que ya tienes sobre venta.

**PLAN DE ACCIÓN PARA PROCESAMIENTO**

<Aquí tu respuesta>

## Procesamiento de nuevos datos

Pon en marcha el plan de acción definido de manera ordenada.

## Análisis de nuevos datos

### ¿Cuál es el comportamiento mensual del precio pagado por pasajero?

**CONCLUSIONES**

<Aquí tu respuesta>

### ¿Cómo se comporta el precio pagado por pasajero por canal?

**CONCLUSIONES**

<Aquí tu respuesta>

### ¿Existen diferencias en el año respecto al tamaño de los tours que viajan por el canal Agencias respecto a los FIT? 

Es importante aclarar que "tamaño de tours" hace referencia a la cantidad de pasajeros en cada tour.

**CONCLUSIONES**

<Aquí tu respuesta>