Predecir ingresos de una aplicación
📘 Enunciado del ejercicio:

Eres parte de un equipo de analistas de datos en una empresa tecnológica que desarrolla aplicaciones móviles. Te han proporcionado un pequeño conjunto de datos con información sobre diferentes apps que ya están publicadas, y tu tarea es crear un modelo de regresión lineal para predecir los ingresos estimados de una nueva app.



📊 Datos disponibles por app:

app_name: Nombre de la app

downloads: Número de descargas (en miles)

rating: Valoración media de los usuarios (de 1 a 5)

size_mb: Tamaño de la app (en MB)

reviews: Número de valoraciones escritas

revenue: Ingresos generados (en miles de dólares) → variable a predecir



📌 Tareas que debes realizar:

Crea una clase App que represente cada app con sus atributos.

Crea una clase RevenuePredictor que:

Reciba una lista de objetos App.

Extraiga las características relevantes para entrenar un modelo.

Entrene un modelo de regresión lineal para predecir los ingresos (revenue).

Permita predecir los ingresos de una nueva app con datos similares.

Entrena el modelo con los datos proporcionados (puedes usar una lista de ejemplo en el código).

Prueba el modelo prediciendo los ingresos estimados de una nueva app ficticia.



🧪 Ejemplo de uso

# Datos simulados de entrenamiento
training_apps = [
    App("TaskPro", 200, 4.2, 45.0, 1800, 120.0),
    App("MindSpark", 150, 4.5, 60.0, 2100, 135.0),
    App("WorkFlow", 300, 4.1, 55.0, 2500, 160.0),
    App("ZenTime", 120, 4.8, 40.0, 1700, 140.0),
    App("FocusApp", 180, 4.3, 52.0, 1900, 130.0),
    App("BoostApp", 220, 4.0, 48.0, 2300, 145.0),
]
 
# Creamos y entrenamos el predictor
predictor = RevenuePredictor()
predictor.fit(training_apps)
 
# Nueva app para predecir
new_app = App("FocusMaster", 250, 4.5, 50.0, 3000)
predicted_revenue = predictor.predict(new_app)
 
print(f"Ingresos estimados para {new_app.name}: ${predicted_revenue:.2f}K")


Salida esperada

Ingresos estimados para FocusMaster: $207.59K


In [1]:
class App:
    def __init__(self, name, downloads, rating, size_mb, reviews, revenue=None):
        self.name = name
        self.downloads = downloads
        self.rating = rating
        self.size_mb = size_mb
        self.reviews = reviews
        self.revenue = revenue  
    def to_features(self):
        return [self.downloads, self.rating, self.size_mb, self.reviews]
from sklearn.linear_model import LinearRegression
class RevenuePredictor:
    def __init__(self):
        self.model = LinearRegression()
    def fit(self, apps):
        X = [app.to_features() for app in apps]
        y = [app.revenue for app in apps if app.revenue is not None]
        self.model.fit(X, y)
    def predict(self, app):
        X_new = [app.to_features()]
        return self.model.predict(X_new)[0]  

In [2]:
# Datos simulados de entrenamiento
training_apps = [
    App("TaskPro", 200, 4.2, 45.0, 1800, 120.0),
    App("MindSpark", 150, 4.5, 60.0, 2100, 135.0),
    App("WorkFlow", 300, 4.1, 55.0, 2500, 160.0),
    App("ZenTime", 120, 4.8, 40.0, 1700, 140.0),
    App("FocusApp", 180, 4.3, 52.0, 1900, 130.0),
    App("BoostApp", 220, 4.0, 48.0, 2300, 145.0),
]
 
# Creamos y entrenamos el predictor
predictor = RevenuePredictor()
predictor.fit(training_apps)
 
# Nueva app para predecir
new_app = App("FocusMaster", 250, 4.5, 50.0, 3000)
predicted_revenue = predictor.predict(new_app)
 
print(f"Ingresos estimados para {new_app.name}: ${predicted_revenue:.2f}K")

Ingresos estimados para FocusMaster: $207.59K
