<a href="https://colab.research.google.com/github/luismiguelcasadodiaz/IBM_SkillsBuild_IA_325/blob/main/IA_325_py_cod_ex_19_s.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Predecir futuro de una app ¿Tendrá éxito tu app?

## 📱 Contexto

Eres parte de un equipo de análisis de una startup que lanza apps móviles. Se te ha asignado la tarea de construir un modelo que pueda predecir si una app será exitosa o no en función de sus métricas iniciales.

La empresa ha recopilado datos de otras apps anteriores, tanto exitosas como fallidas, y quiere automatizar este análisis con Machine Learning.

## 🎯 Objetivo

Crea un sistema en Python que permita:

+ Representar los datos de una app.
+ Preparar un conjunto de datos a partir de múltiples apps.
+ Entrenar un modelo de regresión logística con scikit-learn.
+ Predecir si una app será exitosa.
+ De forma opcional, mostrar la probabilidad de éxito.

## 🧱 Estructura del proyecto

Debes implementar las siguientes clases:

+ 📦 App: Representa una app móvil con las siguientes:

  + Atributos
    + app_name: nombre de la app.
    + monthly_users: número de usuarios mensuales.
    + avg_session_length: duración media de las sesiones (en minutos).
    + retention_rate: tasa de retención entre 0 y 1.
    + social_shares: número de veces que se ha compartido en redes sociales.
    + success: valor opcional (1 = éxito, 0 = fracaso).

  + Métodos:
    + to_features(self): devuelve una lista de características numéricas.
<br>
<br>
+ 📊 AppDataset: Representa un conjunto de datos de apps con las siguientes:
  
  + Atributos
    + Lista de objetos App.

  + Métodos:
    + get_feature_matrix(self): devuelve una matriz de características.
    + get_target_vector(self): devuelve un vector de etiquetas (success).
<br>
<br>
+🤖 SuccessPredictor: Encargado de entrenar y usar el modelo de regresión logística.

  + Métodos:
    + train(dataset): entrena el modelo usando un AppDataset.
    + predict(app): devuelve 1 o 0 para predecir si la app será exitosa.
    + predict_proba(app): (opcional) devuelve la probabilidad de éxito como número decimal entre 0 y 1.

💡 Sugerencia: puedes usar StandardScaler para mejorar la precisión del modelo escalando los datos.



## 🧪 Ejemplo de uso

### Datos de entrenamiento
```python
apps = [
    App("FastChat", 10000, 12.5, 0.65, 1500, 1),
    App("FitTrack", 500, 5.0, 0.2, 50, 0),
    App("GameHub", 15000, 25.0, 0.75, 3000, 1),
    App("BudgetBuddy", 800, 6.5, 0.3, 80, 0),
    App("EduFlash", 12000, 18.0, 0.7, 2200, 1),
    App("NoteKeeper", 600, 4.0, 0.15, 30, 0)
]

dataset = AppDataset(apps)
predictor = SuccessPredictor()
predictor.train(dataset)
```

###  Nueva app a evaluar
```python
new_app = App("StudyBoost", 20000, 15.0, 0.5, 700)
predicted_success = predictor.predict(new_app)
prob = predictor.predict_proba(new_app)

print(f"¿Será exitosa la app {new_app.app_name}? {'Sí' if predicted_success else 'No'}")
print(f"Probabilidad estimada de éxito: {prob:.2f}")
```


🧪 Salida esperada

¿Será exitosa la app StudyBoost? Sí

Probabilidad estimada de éxito: 0.83


### Definición de la clase App

In [37]:
class App:
  def __init__(self, app_name, monthly_users, avg_session_length,
               retention_rate, social_shares, success=None):
    if not isinstance(app_name, str):
        raise TypeError("app_name debe ser un texto")
    self.app_name = app_name

    if not isinstance(monthly_users, int) or monthly_users <= 0:
        raise ValueError("monthly_users debe ser un entero positivo")
    self.monthly_users = monthly_users

    if not isinstance(avg_session_length, float) or avg_session_length <= 0:
        raise ValueError("avg_session_length debe ser float positivo")
    self.avg_session_length = avg_session_length

    if not (0 <= retention_rate  and retention_rate  <= 1):
        raise ValueError("retention_rate debe ser 0 <= x <= 1")
    self.retention_rate = retention_rate

    if not isinstance(social_shares, int) or social_shares < 0:
        raise ValueError("social_shares debe ser un entero positivo")
    self.social_shares = social_shares

    if success is not None and success not in [0, 1]:
        raise ValueError("success must debe ser o 0 o 1")
    self.success = success

  def to_features(self):
    """
    Devuelve una lista de características numéricas.
    """
    return [vars(self)[key] for key in vars(self) if key != 'app_name']

#### Pruebas a la clase App

In [38]:
una = App("una", 10000, 12.5, 0.65, 1500, 1)
dos = App("dos", 10000, 12.5, 0.65, 1500)
print(una.to_features())
print(dos.to_features())
dos = App("dos", 10000, 12.5, 0.65, 1500)

[10000, 12.5, 0.65, 1500, 1]
[10000, 12.5, 0.65, 1500, None]


### Definición de la clase AppDataset

In [39]:
class AppDataset:
    """Maneja un conjunto de objetos App.

    Almacena una lista de objetos App y extrae matrices de
    características y vectores objetivo para aprendizaje automático.
    """
    def __init__(self, lista_apps=None):
        """Inicializa un objeto AppDataset.

        Args:
            lista_apps (list, optional): Lista inicial de objetos App.
                Por defecto es None (crea una lista vacía).
        """
        if lista_apps is None:
            self.lista_apps = []
        else:
            self.lista_apps = lista_apps

    def get_feature_matrix(self):
        """Devuelve matriz de características de los objetos App.

        Cada fila es una App, las columnas son sus características
        numéricas (excepto 'success').

        Returns:
            list: Lista de listas con características numéricas por App.
                  Retorna lista vacía si el dataset está vacío.
        """
        if not self.lista_apps:
            return []
        return [app.to_features()[:-1] for app in self.lista_apps]

    def get_target_vector(self):
        """Devuelve vector objetivo ('success') de los objetos App.

        Cada elemento es el valor 'success' de una aplicación.

        Returns:
            list: Lista de los valores 'success' por aplicación.
                  Retorna lista vacía si el dataset está vacío.
        """
        if not self.lista_apps:
            return []
        return [app.to_features()[-1] for app in self.lista_apps]

#### Pruebas a la clase AppDataset

In [40]:
# Uso normal
lista_apps = [
    App("FastChat", 10000, 12.5, 0.65, 1500, 1),
    App("FitTrack", 500, 5.0, 0.2, 50, 0),
    App("GameHub", 15000, 25.0, 0.75, 3000, 1),
    App("BudgetBuddy", 800, 6.5, 0.3, 80, 0),
    App("EduFlash", 12000, 18.0, 0.7, 2200, 1),
    App("NoteKeeper", 600, 4.0, 0.15, 30, 0)
]
obj_appdataset = AppDataset(lista_apps)
print(obj_appdataset.get_feature_matrix())
print(obj_appdataset.get_target_vector())

[[10000, 12.5, 0.65, 1500], [500, 5.0, 0.2, 50], [15000, 25.0, 0.75, 3000], [800, 6.5, 0.3, 80], [12000, 18.0, 0.7, 2200], [600, 4.0, 0.15, 30]]
[1, 0, 1, 0, 1, 0]


In [41]:
# uso la lista vacia
lista_apps = []
obj_appdataset = AppDataset(lista_apps)
print(obj_appdataset.get_feature_matrix())
print(obj_appdataset.get_target_vector())

[]
[]


In [42]:
# uso sin lista
obj_appdataset = AppDataset()
print(obj_appdataset.get_feature_matrix())
print(obj_appdataset.get_target_vector())

[]
[]


## Definición de la clase SuccessPredictor

In [43]:
#!pip install --upgrade scikit-learn
#!pip install numpy==1.26.4
import numpy as np
import sklearn
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report

print(f"Versión de scikit-learn: {sklearn.__version__}")
print(f"Versión de NumPy: {np.__version__}")

Versión de scikit-learn: 1.6.1
Versión de NumPy: 1.26.4


In [44]:
class SuccessPredictor:
    """Predice la probabilidad de éxito de una aplicación.

    Utiliza regresión logística para clasificar aplicaciones
    basándose en sus características.
    """
    def __init__(self):
        """Inicializa el predictor con un modelo y un escalador."""
        self.model = LogisticRegression()
        self.scaler = StandardScaler()

    def train(self, dataset):
        """Entrena el modelo con los datos proporcionados.

        Args:
            dataset (AppDataset): Objeto AppDataset con datos de
                entrenamiento (características y variable objetivo).
        """
        X = dataset.get_feature_matrix()
        y = dataset.get_target_vector()
        self.scaler.fit(X) # calcula avg, std de cada atributo
        X_scaled = self.scaler.transform(X) # escala los datos
        self.model.fit(X_scaled, y)

    def predict(self, nueva_app):
        """Predice si una nueva aplicación será exitosa (1) o no (0).

        Args:
            nueva_app (App): Objeto App con las características a
                predecir.

        Returns:
            int: 1 si la aplicación se predice como exitosa, 0 en caso
                contrario.
        """
        nueva_app_atributos_normalizados = self.scaler.transform(
            [nueva_app.to_features()[:-1]]
        )
        return self.model.predict(nueva_app_atributos_normalizados)[0]

    def predict_proba(self, nueva_app):
        """Devuelve la probabilidad de que una nueva aplicación sea exitosa.

        Args:
            nueva_app (App): Objeto App con las características a
                predecir.

        Returns:
            float: Probabilidad de éxito de la aplicación (valor entre 0 y 1).
        """
        nueva_app_atributos_normalizados = self.scaler.transform(
            [nueva_app.to_features()[:-1]]
        )
        return self.model.predict_proba(nueva_app_atributos_normalizados)[0][1]


#### Pruebas a la clase SuccessPreditor

In [45]:
lista_apps = [
    App("FastChat", 10000, 12.5, 0.65, 1500, 1),
    App("FitTrack", 500, 5.0, 0.2, 50, 0),
    App("GameHub", 15000, 25.0, 0.75, 3000, 1),
    App("BudgetBuddy", 800, 6.5, 0.3, 80, 0),
    App("EduFlash", 12000, 18.0, 0.7, 2200, 1),
    App("NoteKeeper", 600, 4.0, 0.15, 30, 0)
]
obj_appdataset = AppDataset(lista_apps)
predictor = SuccessPredictor()
predictor.train(obj_appdataset)
print(predictor.model.coef_)
print(predictor.model.intercept_)
new_app = App("StudyBoost", 20000, 15.0, 0.5, 700)
predicted_success = predictor.predict(new_app)
prob = predictor.predict_proba(new_app)
print("Prediccion ->",predicted_success)
print(f"¿Será exitosa la app {new_app.app_name}? {'Sí' if predicted_success else 'No'}")
print(f"Probabilidad estimada de éxito: {prob:.2f}")

[[0.62025599 0.4611371  0.64700619 0.54467896]]
[0.13464581]
Prediccion -> 1
¿Será exitosa la app StudyBoost? Sí
Probabilidad estimada de éxito: 0.83
