# ¿Cuál es un mejor plan?

Trabajas como analista para el operador de telecomunicaciones Megaline. La empresa ofrece a sus clientes dos tarifas de prepago, Surf y Ultimate. El departamento comercial quiere saber cuál de los planes genera más ingresos para poder ajustar el presupuesto de publicidad.

Vas a realizar un análisis preliminar de las tarifas basado en una selección de clientes relativamente pequeña. Tendrás los datos de 500 clientes de Megaline: quiénes son los clientes, de dónde son, qué tarifa usan, así como la cantidad de llamadas que hicieron y los mensajes de texto que enviaron en 2018. Tu trabajo es analizar el comportamiento de los clientes y determinar qué tarifa de prepago genera más ingresos.

[Te proporcionamos algunos comentarios para orientarte mientras completas este proyecto. Pero debes asegurarte de eliminar todos los comentarios entre corchetes antes de entregar tu proyecto.]

[Antes de sumergirte en el análisis de datos, explica por tu propia cuenta el propósito del proyecto y las acciones que planeas realizar.]

[Ten en cuenta que estudiar, modificar y analizar datos es un proceso iterativo. Es normal volver a los pasos anteriores y corregirlos/ampliarlos para permitir nuevos pasos.]

# Análisis de planes de telefonía: ¿cuál es el más rentable?

# Contenido
* [Introducción](#intro)
* [Objetivos](#objetivos)
* [Etapas](#etapas)

# Introducción

En este proyecto analizaremos datos de la empresa de telecomunicaciones Megaline. La empresa ofrece a sus clientes dos tarifas de prepago: Surf y Ultimate. El trabajo consiste en determinar cuál de estos planes genera más ingresos a la empresa. La(s) hipótesis específica(s) será(n) presentada(s) en los cuadros siguientes y para el desarrollo de este proyecto aplicaremos diversas técnicas utilizadas a lo largo del curso, como el preprocesamiento, análisis exploratorio y análisis estadístico de los datos. Cada espacio de código cuenta con sus respectivos comentarios para un mejor entendimiento del desarrollo del proyecto.

# Objetivos

Nuestras hipótesis específicas a probar serán las siguientes:
* Existe una diferencia entre el ingreso promedio de los ususarios de las tarifas Ultimate y Surf.
* Existe una diferencia entre el ingreso promedio de los usuario en el área de estados Nueva York-Nueva Jersey al de los usuarios de otras regiones.

# Etapas del análisis

En este proyecto, seguiremos este esquema propuesto de manera general para ordenar el proceso de análisis. Se aclara que, debido a que no se tiene mucha información respecto a la calidad de los datos ni contacto con el área relacionada, el tratamiento de datos y análisis exploratorio se realizará usando supuestos razonables desde el punto de vista del analista. El esquema es:
1. Descripción de los datos
2. Preprocesamiento de los datos
3. Análisis exploratorio de datos
4. Prueba de las hipótesis
5. Conclusiones finales

## Inicialización

**Carga de librerías necesarias**

In [3]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats as st

# Cargar todas las librerías

## Cargar los datos

In [4]:

try:
    users = pd.read_csv("megaline_users.csv")
    calls = pd.read_csv("megaline_calls.csv")
    internet = pd.read_csv("megaline_internet.csv")
    messages = pd.read_csv("megaline_messages.csv")
    plans = pd.read_csv("megaline_plans.csv")
except:
    users = pd.read_csv("/datasets/megaline_users.csv")
    calls = pd.read_csv("/datasets/megaline_calls.csv")
    internet = pd.read_csv("/datasets/megaline_internet.csv")
    messages = pd.read_csv("/datasets/megaline_messages.csv")
    plans = pd.read_csv("/datasets/megaline_plans.csv")
# Carga los archivos de datos en diferentes DataFrames

## Preparar los datos

[Los datos para este proyecto se dividen en muchas tablas. Explora cada una para tener una comprensión inicial de los datos. Si es necesario, haz las correcciones necesarias a cada tabla.]

## Planes

In [4]:
# Imprime la información general/resumen sobre el DataFrame de los planes


In [5]:
# Imprime una muestra de los datos para los planes


[Describe lo que ves y busca en la información general y en la muestra impresa de los datos el precio de arriba de los datos. ¿Hay algún problema (tipos de datos no adecuados, datos ausentes, etc.) que pudieran necesitar investigación y cambios adicionales? ¿Cómo pueden corregirse?]

## Corregir los datos

[Corrige los problemas obvios con los datos basándote en las observaciones iniciales.]

## Enriquecer los datos

[Agrega factores adicionales a los datos si crees que pudieran ser útiles.]

## Usuarios

In [6]:
# Imprime la información general/resumen sobre el DataFrame de los usuarios


In [7]:
# Imprime una muestra de los datos para los usuarios


[Describe lo que ves y busca en la información general y en la muestra impresa de los datos el precio de arriba de los datos. ¿Hay algún problema (tipos de datos no adecuados, datos ausentes, etc.) que pudieran necesitar investigación y cambios adicionales? ¿Cómo pueden corregirse?]

### Corregir datos

[Corrige los problemas obvios con los datos basándote en las observaciones iniciales.]

### Enriquecer datos

[Agrega factores adicionales a los datos si crees que pudieran ser útiles.]

## Llamadas

In [8]:
# Imprime la información/resumen general sobre el DataFrame de las llamadas


In [9]:
# Imprime una muestra de datos para llamadas


[Describe lo que ves y busca en la información general y en la muestra impresa de los datos el precio de arriba de los datos. ¿Hay algún problema (tipos de datos no adecuados, datos ausentes, etc.) que pudieran necesitar investigación y cambios adicionales? ¿Cómo pueden corregirse?]

### Corregir datos

[Corrige los problemas obvios con los datos basándote en las observaciones iniciales.]

### Enriquecer datos

[Agrega factores adicionales a los datos si crees que pudieran ser útiles.]

## Mensajes

In [10]:
# Imprime la información/resumen general sobre el DataFrame de los mensajes


In [1]:
# Imprime una muestra de datos para los mensajes


[Describe lo que ves y busca en la información general y en la muestra impresa de los datos el precio de arriba de los datos. ¿Hay algún problema (tipos de datos no adecuados, datos ausentes, etc.) que pudieran necesitar investigación y cambios adicionales? ¿Cómo pueden corregirse?]

### Corregir datos

[Corrige los problemas obvios con los datos basándote en las observaciones iniciales.]

### Enriquecer datos

[Agrega factores adicionales a los datos si crees que pudieran ser útiles.]

## Internet

In [11]:
# Imprime la información/resumen general sobre el DataFrame de los mensajes


In [12]:
# Imprime una muestra de datos para el tráfico de internet


[Describe lo que ves y busca en la información general y en la muestra impresa de los datos el precio de arriba de los datos. ¿Hay algún problema (tipos de datos no adecuados, datos ausentes, etc.) que pudieran necesitar investigación y cambios adicionales? ¿Cómo pueden corregirse?]

### Corregir datos

[Corrige los problemas obvios con los datos basándote en las observaciones iniciales.]

### Enriquecer datos

[Agrega factores adicionales a los datos si crees que pudieran ser útiles.]

## Estudiar las condiciones del plan

[Es sumamente importante entender cómo funcionan los planes, cómo se cobra a los usuarios con base en su plan de suscripción. Así que te sugerimos imprimir la información del plan para ver una vez más sus condiciones.]

In [13]:
# Imprime las condiciones del plan y asegúrate de que te resulten claros


## Agregar datos por usuario

[Ahora que los datos están limpios, agrega los datos por usuario por periodo para poder tener solo un registro por usuario por periodo. Esto facilitará mucho su posterior análisis.]

In [14]:
# Calcula el número de llamadas hechas por cada usuario por mes. Guarda el resultado.



In [15]:
# Calcula la cantidad de minutos que usó cada usuario por mes. Guarda el resultado.



In [16]:
# Calcula el número de mensajes enviados por cada usuario por mes. Guarda el resultado.



In [17]:
# Calcula el volumen del trafico de internet usado por cada usuario por mes. Guarda el resultado.



[Pon los datos agregados juntos en un DataFrame para que un registro en él represente lo que un único usuario consumió en un mes determinado.]

In [18]:
# Combina los datos para las llamadas, minutos, mensajes e internet con base en el user_id y el mes


In [19]:
# Añade la información del plan


[Los ingresos mensuales de cada usuario (resta el límite del paquete gratuito del número total de llamadas, SMS y datos; multiplica el resultado por el valor de tarifa de llamadas; agrega el cargo mensual según la tarifa de llamadas). Nota: Dadas las condiciones de plan, ¡esto podría no ser tan trivial como un par de líneas! Así que está bien ocuparse de ello.]

In [20]:
# Calcula el ingreso mensual para cada usuario


## Estudia el comportamiento del usuario

[Calcula algunas estadísticas descriptivas para los datos agregados y fusionados que nos sean útiles y que muestren un panorama general captado por los datos. Dibuja gráficos útiles para facilitar la comprensión. Dado que la tarea principal es comparar los planes y decidir cuál es más rentable, las estadísticas y gráficas deben calcularse por plan.]

[En los comentarios hallarás pistas relevantes para las llamadas, pero no las hay para los mensajes e Internet, sin embargo, el principio del estudio estadístico es el mismo que para las llamadas.]

### Llamadas

In [21]:
# Compara la duración promedio de llamadas por cada plan por cada mes. Dibuja una gráfica de barras para visualizarlo.



In [22]:
# Compara el número de minutos que los usuarios de cada plan requieren cada mes. Traza un histograma.



[Calcula la media y la variable de la duración de la llamada para concluir si los usuarios de diferentes planes muestran comportamientos distintos para sus llamadas.]

In [23]:
# Calcula la media y la varianza de la duración mensual de llamadas.


In [25]:
# Traza un diagrama de caja para visualizar la distribución de la duración mensual de llamadas.


[Elabora las conclusiones sobre cómo se comportan los usuarios en cuanto a las llamadas. ¿Este comportamiento es diferente entre los planes?]

### Mensajes

In [26]:
# Comprara el número de mensajes que tienden a enviar cada mes los usuarios de cada plan


In [27]:
# Compara la cantidad de tráfico de internet consumido por usuarios por plan


[Elabora las conclusiones sobre cómo se comportan los usuarios en cuanto a mensajes. ¿Este comportamiento es diferente entre los planes?]

### Internet

[Elabora las conclusiones sobre cómo se comportan los usuarios en cuanto a tráfico de internet. ¿Este comportamiento es diferente entre los planes?]

## Ingreso

[Del mismo modo en que has estudiado el comportamiento del usuario, es decir, estadísticamente, describe el ingreso entre los planes.]

[Elabora las conclusiones sobre cómo difiere el ingreso entre los planes.]

## Probar las hipótesis estadísticas.

[Prueba las hipótesis de que es diferente el ingreso promedio de los usuarios de los planes de llamada Ultimate y Surf.]

[Elabora las hipótesis nula y alterna, escoge la prueba estadística, determina el valor alfa.]

In [28]:
# Prueba las hipótesis


[Prueba la hipótesis de que el ingreso promedio de los usuarios del área NY-NJ es diferente al de los usuarios de otras regiones.

[Elabora las hipótesis nula y alterna, escoge la prueba estadística, determina el valor alfa.]

In [29]:
# Prueba las hipótesis


## Conclusión general

[En esta sección final, enumera tus conclusiones importantes. Asegúrate de que estas abarquen todas las decisiones importantes (suposiciones) que tomaste y que te llevaron a procesar y analizar los datos del modo en que lo hiciste.]