-
El objetivo principal del proyecto es comprender las características de los clientes que compran una bicicleta y desarrollar un sistema de scoring de venta para identificar a los clientes más propensos a realizar una compra. Para lograr esto, se plantean los siguientes objetivos:
-
Analizar el conjunto de datos "bike_buyers.csv" para obtener información detallada sobre los clientes, como su perfil demográfico, comportamiento de compra y preferencias.
-
Identificar las características clave de los clientes que están más inclinados a comprar una bicicleta. Esto puede incluir factores como la edad, el género, los ingresos, la ubicación geográfica, los intereses y otros atributos relevantes.
-
Desarrollar un modelo de scoring de venta utilizando técnicas de aprendizaje automático para predecir la probabilidad de compra de una bicicleta para cada cliente. Este modelo debe ser capaz de clasificar a los clientes en categorías de alta, media o baja propensión de compra.
-
Evaluar la precisión y eficacia del modelo de scoring de venta utilizando métricas adecuadas, como la precisión, el área bajo la curva ROC o la puntuación F1. Esto permitirá medir la capacidad del modelo para predecir de manera efectiva las compras de bicicletas.
-
Representar los objetivos del negocio en términos de metas del proyecto de minería de datos. Esto implica traducir los objetivos comerciales en objetivos específicos que se pueden abordar mediante técnicas de análisis de datos.
-
Identificar la variable a predecir, que en este caso sería la compra de una bicicleta. Esta variable será el objetivo principal del modelo de scoring de venta y se utilizará para clasificar a los clientes en función de su probabilidad de compra.
-
Utilizar técnicas de análisis de datos, como limpieza, transformación, visualización y modelado, para extraer conocimiento útil de los datos y lograr los objetivos establecidos. Esto implica aplicar métodos de aprendizaje automático y estadística para desarrollar un modelo predictivo preciso y robusto
- André Dario Pilco Chiuyare (Business Project Sponsor & Data Analytics) 📊
- Luis Felipe Poma Astete (Data Engineer) 📑
- John Davids Sovero Cubillas (Data Science) 📈
El conjunto de datos utilizado en este proyecto contiene información sobre los clientes. A continuación se muestra una descripción de las columnas incluidas:
El conjunto de datos utilizado en este proyecto contiene información sobre los clientes. A continuación se muestra una descripción de las columnas incluidas:
ID | Marital Status | Gender | Income | Children | Education | Occupation | Home Owner | Cars | Commute Distance | Region | Age | Purchased Bike |
---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Married | Male | 50000 | 2 | Bachelors | Professional | Yes | 1 | Short | East | 35 | Yes |
2 | Single | Female | 35000 | 0 | High School | Technician | No | 2 | Medium | West | 28 | No |
3 | Divorced | Male | 75000 | 1 | Bachelors | Management | Yes | 3 | Long | South | 42 | Yes |
4 | Single | Male | 25000 | 1 | High School | Skilled | No | 0 | Short | North | 30 | No |
5 | Married | Female | 65000 | 3 | Graduate | Professional | Yes | 2 | Long | West | 38 | Yes |
- ID: Identificador único para cada cliente. 🔢
- Marital Status: Estado civil del cliente. 👫
- Gender: Género del cliente. 👩 👨
- Income: Ingresos del cliente. 💰
- Children: Número de hijos del cliente. 👶
- Education: Nivel educativo del cliente. ✏️
- Occupation: Ocupación del cliente. 👷
- Home Owner: Indica si el cliente es propietario de una vivienda (sí/no). 🏠
- Cars: Número de autos que posee el cliente. 🚗
- Commute Distance: Distancia promedio del trayecto diario al trabajo. 📏
- Region: Región geográfica del cliente. 🗾
- Age: Edad del cliente. 📅
- Purchased Bike: Indica si el cliente ha comprado una bicicleta (sí/no). 🚲
El conjunto de datos completo se encuentra disponible en el archivo adjunto en formato CSV: Conjunto de Datos.
El presente trabajo ha permitido manejar datos reales en un contexto real con requerimientos precisos y demandantes. Además, ha propiciado la construcción de un modelo predictivo funcional que se adapta a las necesidades y objetivos del proyecto. En cuanto a estos, podemos determinar que las características de los clientes que compran una bicicleta son la cantidad de vehículos que posee, la edad y sus ingresos. Por otro lado, se implementó un scoring de venta que permite clasificar a los clientes en “clientes asegurados”, “clientes potenciales” y “clientes no elegibles”. Esta segmentación permitirá maximizar las ganancias al identificar el correcto público objetivo y optimizar los recursos empleados para su efectiva captación.
Los resultados obtenidos no fueron extraídos de manera sencilla, por lo cual la perseverancia y el compromiso de cada uno de los integrantes del equipo fueron imprescindibles en este proceso. Como todo proyecto, es posible mejorar y perfeccionar ciertos aspectos; en nuestro caso, se podrían realizar más tareas de preparación de los datos para mejorar la precisión y exactitud de nuestro modelo.
Este proyecto se encuentra bajo la licencia MIT. Consulta el archivo LICENSE para obtener más información sobre los términos y condiciones de uso.