# Análisis de datos con Pandas 

En este proyecto final del curso, vamos a analizar los datos recolectados a través de una [encuesta](https://docs.google.com/forms/d/184fandfrCOy9OPh5QIkk1BjM8-1QyS5YZ4CYW30MK1A/viewform?edit_requested=true) realizada por la firma de moda ecuatoriana LIA PADILLA, próxima a abrir su tienda digital.


<div align="center">
    <a href="https://www.liapadilla.art/">
      <img src="https://static.wixstatic.com/media/21d36e_649ca259efb345bb9c572d54cc8e4f4f~mv2.png/v1/fill/w_917,h_235,al_c,lg_1,q_85,enc_auto/21d36e_649ca259efb345bb9c572d54cc8e4f4f~mv2.png" width="500">
    </a>
</div>


El objetivo de este análisis es identificar los segmentos ideales y canales para enfocar los esfuerzos de venta como campañas de comunicación, publicidad y estrategias de marketing digital. 


Para lograr esto, utilizaremos diversas técnicas de análisis de datos con pandas, desde la limpieza y preparación de los datos hasta la exploración y visualización. A través de este proyecto, los estudiantes tendrán la oportunidad de aplicar los conocimientos adquiridos durante el curso y desarrollar habilidades en el manejo de datos para la toma de decisiones estratégicas en el campo del marketing y la publicidad.

Empecemos analizando el diccionario de datos.


| Columna                         | Tipo        | Descripción                                                       |
|---------------------------------|-------------|-------------------------------------------------------------------|
| id                              | STRING      | Identificador único de respuesta                                  |
| fecha                           | DATETIME    | Hora y fecha de la respuesta                                       |
| rango_edad                      | CATEGORICAL | Rangos de edad 18-65 años                                          |
| sexo                            | CATEGORICAL | Sexo                                                              |
| lugar_residencia                | CATEGORICAL | Sector de residencia en la ciudad de Quito                          |
| nivel_estudios                  | CATEGORICAL | Nivel de estudios                                                  |
| sistema_operativo               | CATEGORICAL | Sistema operativo del teléfono celular                             |
| red_social_favorita             | CATEGORICAL | Red social favorita                                                |
| intereses                       | STRING      | Áreas de interes separadas por coma                                |
| canal_compra_favorito           | CATEGORICAL | Canal de compra favorito para consumo de moda                       |
| consumo_mensual_moda            | CATEGORICAL | Rango de consumo mensual en moda                                   |
| segmento_consumo                | CATEGORICAL | Segmento de consumo de moda                                         |
| conoce_nuestra_marca            | CATEGORICAL | Conoce nuestra marca de moda                                       |
| como_conoce_marca               | CATEGORICAL | ¿Cómo conoce la marca?                                             |
| ocasion_uso_nuestras_prendas    | CATEGORICAL | En qué ocasiones vestiría las prendas de nuestra marca              |
| valoracion_prenda_basica        | CATEGORICAL | ¿En qué rango de precios clasifica a la prenda básica?              |
| valoracion_prenda_semiartesanal | CATEGORICAL | ¿En qué rango de precios clasifica a la prenda semiartesanal?       |
| valoracion_prenda_vestido_coleccion | CATEGORICAL | ¿En qué rango de precios clasifica al vestido?                  |
| valoracion_prenda_alta_costura  | CATEGORICAL | ¿En qué rango de precios clasifica a la prenda alta costura?        |
| valoracion_prenda_personalizada | CATEGORICAL | ¿En qué rango de precios clasifica a la prenda personalizada?       |
| caracteristicas_calidad_que_valora | STRING | Características de calidad que valora                           |
| caracteristicas_servicio_que_valora | STRING | Características de servicio que valora                          |
| frecuencia_esperada_consumo     | STRING      | Frecuencia esperada de consumo                                     |
| otros_servicios_interes         | CATEGORICAL | Otros servicios de interés                                         |






## 1. Módulos
Importar el módulo `pandas` con el alias `pd`

In [None]:
# Su código aquí
import pandas as pd

## 2. Leer datos
Lea el archivo `encuesta_lia_padilla.xlsx` utilizando pd.read_excel(). Almacene el resultado de la lectura en el objeto `df`.


In [None]:
# Su código aquí
df = pd.read_excel('/content/encuesta_lia_padilla.xlsx')

Utilizando el método `info()` obtenga la información básica del dataframe y responda las siguientes preguntas:
- ¿Cuántas personas respondieron la encuesta?
- ¿Cuántas columnas tiene el dataframe?
- ¿Las columnas tienen datos perdidos?
- ¿El tipo de columna actual corresponde a la naturaleza real de la serie?

In [None]:
# Su código aquí
df.info()

## 3. Caracterización clientes
Utilizando las columnas apropiadas, responda las siguientes preguntas:
- ¿Cuáles son los rangos de edad incluidos en la encuesta? y ¿cuántos encuestados hay en cada rango?
 
Hint: Utilice el método `value_counts()` sobre la serie apropiada. ¿Qué pasa si utiliza el argumento `normalize = True`?

In [None]:
# Su código aquí

Realice gráficos que nos ayuden a entender los siguientes segmentos de la encuesta:
- Sexo
- Lugar de residencia
- Nivel de estudios
- Sistema operativo del dispositivo
- Red social favorita
- Conoce nuestra marca

Hint: Primero determine qué tipo de gráfico desea para cada segmento. Luego pregunte a `chatGPT` cómo realizar el tipo de gráfico deseado a partir de una serie de pandas. Finalmente experimente con el código obtenido añadiendo colores, etiquetas, etc.

In [None]:
# Su código aquí

In [None]:
# Su código aquí

In [None]:
# Su código aquí

In [None]:
# Su código aquí

## 4. Variables de negocio
Es momento de enfocarnos en el negocio. Responda las siguientes preguntas utilizando pandas.

- ¿Cuál es el canal de compra favorito de los entrevistados?
- ¿Cuál es el rango de consumo mensual de moda de los entrevistados?
- ¿Qué segmento de consumo es el preferido por los entrevistados?



In [None]:
# Su código aquí

In [None]:
# Su código aquí

In [None]:
# Su código aquí

## 5. Análisis bivariable
Analizar las interacciones entre variables es generalmente la mejor manera de llegar a conclusiones que no son notorias a primera vista. Responda a las siguientes preguntas con la ayuda de tablas cruzadas:

- ¿Qué segmento tiene tiene un mayor consumo mensual en moda?
- ¿Qué rango de edad tiene mayor consumo de moda?
- ¿Existe una relación entre las el lugar de residencia y el consumo en moda?
- ¿Existe una relación entre el sistema operativo (poder adquisitivo) y el rango de consumo mensual?
- ¿Existe una relación entre el canal de compra y los rangos de edad?
- ¿Existe una relación entre las redes sociales favoritas de compra y los rangos de edad?

In [None]:
# Su código aquí

In [None]:
# Su código aquí

In [None]:
# Su código aquí

In [None]:
# Su código aquí

In [None]:
# Su código aquí

In [None]:
# Su código aquí