<a href="https://colab.research.google.com/github/luismiguelcasadodiaz/IBM_SkillsBuild_IA_325/blob/main/IA_325_py_cod_ex_15_s.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Predecir ingresos de una aplicación

Eres parte de un equipo de analistas de datos en una empresa tecnológica que desarrolla aplicaciones móviles. Te han proporcionado un pequeño conjunto de datos con información sobre diferentes apps que ya están publicadas, y tu tarea es crear un modelo de regresión lineal para predecir los ingresos estimados de una nueva app.



## Datos disponibles por app:

+ app_name: Nombre de la app
+ downloads: Número de descargas (en miles)
+ rating: Valoración media de los usuarios (de 1 a 5)
+ size_mb: Tamaño de la app (en MB)
+ reviews: Número de valoraciones escritas
+ revenue: Ingresos generados (en miles de dólares) → variable a predecir



## Tareas que debes realizar:

+ Crea una clase App que represente cada app con sus atributos.

+ Crea una clase RevenuePredictor que:

  + Reciba una lista de objetos App.

  + Extraiga las características relevantes para entrenar un modelo.

  + Entrene un modelo de regresión lineal para predecir los ingresos (revenue).

  + Permita predecir los ingresos de una nueva app con datos similares.

+ Entrena el modelo con los datos proporcionados (puedes usar una lista de ejemplo en el código).

+ Prueba el modelo prediciendo los ingresos estimados de una nueva app ficticia.



##  Ejemplo de uso

### Datos simulados de entrenamiento
```python
training_apps = [
    App("TaskPro", 200, 4.2, 45.0, 1800, 120.0),
    App("MindSpark", 150, 4.5, 60.0, 2100, 135.0),
    App("WorkFlow", 300, 4.1, 55.0, 2500, 160.0),
    App("ZenTime", 120, 4.8, 40.0, 1700, 140.0),
    App("FocusApp", 180, 4.3, 52.0, 1900, 130.0),
    App("BoostApp", 220, 4.0, 48.0, 2300, 145.0),
]

# Creamos y entrenamos el predictor
predictor = RevenuePredictor()
predictor.fit(training_apps)

# Nueva app para predecir
new_app = App("FocusMaster", 250, 4.5, 50.0, 3000)
predicted_revenue = predictor.predict(new_app)

print(f"Ingresos estimados para {new_app.name}: ${predicted_revenue:.2f}K")
```

### Salida esperada

Ingresos estimados para FocusMaster: $207.59K

In [33]:
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split

## Creación de la clase App

In [34]:
class App:
  def __init__(self, app_name: str, downloads: float, rating: float, size_mb: float, reviews: int, revenue: float = None):
      """
      Inicializa una instancia de la clase App.

      Parámetros:
      - app_name (str): Nombre de la aplicación.
      - downloads (float): Número de descargas en miles.
      - rating (float): Valoración media de los usuarios (1 a 5).
      - size_mb (float): Tamaño de la app en megabytes.
      - reviews (int): Número de valoraciones escritas.
      - revenue (float): Ingresos generados en miles de dólares. Puede ser None si se desea predecir.
      """
      self.name = app_name
      self.downloads = downloads
      self.rating = rating
      self.size_mb = size_mb
      self.reviews = reviews
      self.revenue = revenue

  def to_dict(self):
      """Convierte la instancia de App en un diccionario (útil para crear DataFrames)."""
      return {
          "name": self.name,
          "downloads": self.downloads,
          "rating": self.rating,
          "size_mb": self.size_mb,
          "reviews": self.reviews,
          "revenue": self.revenue
      }

  def to_features(self):
      """Convierte la instancia de App en un lista de variables independientes."""
      dict_app = self.to_dict()
      return list(dict_app.values())[1:-1]

  def __repr__(self):
      return (f"App(name='{self.name}', downloads={self.downloads}, "
              f"rating={self.rating}, size_mb={self.size_mb}, reviews={self.reviews}, "
              f"revenue={self.revenue})")


#### Test de la clase App

In [35]:
una = App("WorkFlow", 300, 4.1, 55.0, 2500, 160.0)
print(una)
print(una.to_dict())
print(una.to_features())

App(name='WorkFlow', downloads=300, rating=4.1, size_mb=55.0, reviews=2500, revenue=160.0)
{'name': 'WorkFlow', 'downloads': 300, 'rating': 4.1, 'size_mb': 55.0, 'reviews': 2500, 'revenue': 160.0}
[300, 4.1, 55.0, 2500]


## Crea la clase  RevenuePredictor

In [36]:
class RevenuePredictor:
  def __init__(self, apps: list[App] = None):
    self.apps = apps
    self.model = LinearRegression()

  def _prepara_datos(self):
    X = [app.to_features() for app in self.apps]
    y = [app.revenue for app in self.apps]
    return X, y

  def fit(self, apps: list[App] = None ):
    self.apps = apps
    X, y = self._prepara_datos()
    self.model.fit(X, y)

  def predict(self, app: App):
    X = [app.to_features()]
    return self.model.predict(X)[0]

In [37]:
training_apps = [
    App("TaskPro", 200, 4.2, 45.0, 1800, 120.0),
    App("MindSpark", 150, 4.5, 60.0, 2100, 135.0),
    App("WorkFlow", 300, 4.1, 55.0, 2500, 160.0),
    App("ZenTime", 120, 4.8, 40.0, 1700, 140.0),
    App("FocusApp", 180, 4.3, 52.0, 1900, 130.0),
    App("BoostApp", 220, 4.0, 48.0, 2300, 145.0),
]

# Creamos y entrenamos el predictor
predictor = RevenuePredictor()
predictor.fit(training_apps)

# Nueva app para predecir
new_app = App("FocusMaster", 250, 4.5, 50.0, 3000)
predicted_revenue = predictor.predict(new_app)

print(f"Ingresos estimados para {new_app.name}: ${predicted_revenue:.2f}K")

Ingresos estimados para FocusMaster: $207.59K
