<a href="https://colab.research.google.com/github/luismiguelcasadodiaz/IBM_SkillsBuild_IA_325/blob/main/IA_325_py_cod_ex_19_s.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Predecir futuro de una app Â¿TendrÃ¡ Ã©xito tu app?

## ðŸ“± Contexto

Eres parte de un equipo de anÃ¡lisis de una startup que lanza apps mÃ³viles. Se te ha asignado la tarea de construir un modelo que pueda predecir si una app serÃ¡ exitosa o no en funciÃ³n de sus mÃ©tricas iniciales.

La empresa ha recopilado datos de otras apps anteriores, tanto exitosas como fallidas, y quiere automatizar este anÃ¡lisis con Machine Learning.

## ðŸŽ¯ Objetivo

Crea un sistema en Python que permita:

+ Representar los datos de una app.
+ Preparar un conjunto de datos a partir de mÃºltiples apps.
+ Entrenar un modelo de regresiÃ³n logÃ­stica con scikit-learn.
+ Predecir si una app serÃ¡ exitosa.
+ De forma opcional, mostrar la probabilidad de Ã©xito.

## ðŸ§± Estructura del proyecto

Debes implementar las siguientes clases:

+ ðŸ“¦ App: Representa una app mÃ³vil con las siguientes:

  + Atributos
    + app_name: nombre de la app.
    + monthly_users: nÃºmero de usuarios mensuales.
    + avg_session_length: duraciÃ³n media de las sesiones (en minutos).
    + retention_rate: tasa de retenciÃ³n entre 0 y 1.
    + social_shares: nÃºmero de veces que se ha compartido en redes sociales.
    + success: valor opcional (1 = Ã©xito, 0 = fracaso).

  + MÃ©todos:
    + to_features(self): devuelve una lista de caracterÃ­sticas numÃ©ricas.
<br>
<br>
+ ðŸ“Š AppDataset: Representa un conjunto de datos de apps con las siguientes:
  
  + Atributos
    + Lista de objetos App.

  + MÃ©todos:
    + get_feature_matrix(self): devuelve una matriz de caracterÃ­sticas.
    + get_target_vector(self): devuelve un vector de etiquetas (success).
<br>
<br>
+ðŸ¤– SuccessPredictor: Encargado de entrenar y usar el modelo de regresiÃ³n logÃ­stica.

  + MÃ©todos:
    + train(dataset): entrena el modelo usando un AppDataset.
    + predict(app): devuelve 1 o 0 para predecir si la app serÃ¡ exitosa.
    + predict_proba(app): (opcional) devuelve la probabilidad de Ã©xito como nÃºmero decimal entre 0 y 1.

ðŸ’¡ Sugerencia: puedes usar StandardScaler para mejorar la precisiÃ³n del modelo escalando los datos.



## ðŸ§ª Ejemplo de uso

### Datos de entrenamiento
```python
apps = [
    App("FastChat", 10000, 12.5, 0.65, 1500, 1),
    App("FitTrack", 500, 5.0, 0.2, 50, 0),
    App("GameHub", 15000, 25.0, 0.75, 3000, 1),
    App("BudgetBuddy", 800, 6.5, 0.3, 80, 0),
    App("EduFlash", 12000, 18.0, 0.7, 2200, 1),
    App("NoteKeeper", 600, 4.0, 0.15, 30, 0)
]

dataset = AppDataset(apps)
predictor = SuccessPredictor()
predictor.train(dataset)
```

###  Nueva app a evaluar
```python
new_app = App("StudyBoost", 20000, 15.0, 0.5, 700)
predicted_success = predictor.predict(new_app)
prob = predictor.predict_proba(new_app)

print(f"Â¿SerÃ¡ exitosa la app {new_app.app_name}? {'SÃ­' if predicted_success else 'No'}")
print(f"Probabilidad estimada de Ã©xito: {prob:.2f}")
```


ðŸ§ª Salida esperada

Â¿SerÃ¡ exitosa la app StudyBoost? SÃ­

Probabilidad estimada de Ã©xito: 0.83


### DefiniciÃ³n de la clase App

In [37]:
class App:
  def __init__(self, app_name, monthly_users, avg_session_length,
               retention_rate, social_shares, success=None):
    if not isinstance(app_name, str):
        raise TypeError("app_name debe ser un texto")
    self.app_name = app_name

    if not isinstance(monthly_users, int) or monthly_users <= 0:
        raise ValueError("monthly_users debe ser un entero positivo")
    self.monthly_users = monthly_users

    if not isinstance(avg_session_length, float) or avg_session_length <= 0:
        raise ValueError("avg_session_length debe ser float positivo")
    self.avg_session_length = avg_session_length

    if not (0 <= retention_rate  and retention_rate  <= 1):
        raise ValueError("retention_rate debe ser 0 <= x <= 1")
    self.retention_rate = retention_rate

    if not isinstance(social_shares, int) or social_shares < 0:
        raise ValueError("social_shares debe ser un entero positivo")
    self.social_shares = social_shares

    if success is not None and success not in [0, 1]:
        raise ValueError("success must debe ser o 0 o 1")
    self.success = success

  def to_features(self):
    """
    Devuelve una lista de caracterÃ­sticas numÃ©ricas.
    """
    return [vars(self)[key] for key in vars(self) if key != 'app_name']

#### Pruebas a la clase App

In [38]:
una = App("una", 10000, 12.5, 0.65, 1500, 1)
dos = App("dos", 10000, 12.5, 0.65, 1500)
print(una.to_features())
print(dos.to_features())
dos = App("dos", 10000, 12.5, 0.65, 1500)

[10000, 12.5, 0.65, 1500, 1]
[10000, 12.5, 0.65, 1500, None]


### DefiniciÃ³n de la clase AppDataset

In [39]:
class AppDataset:
    """Maneja un conjunto de objetos App.

    Almacena una lista de objetos App y extrae matrices de
    caracterÃ­sticas y vectores objetivo para aprendizaje automÃ¡tico.
    """
    def __init__(self, lista_apps=None):
        """Inicializa un objeto AppDataset.

        Args:
            lista_apps (list, optional): Lista inicial de objetos App.
                Por defecto es None (crea una lista vacÃ­a).
        """
        if lista_apps is None:
            self.lista_apps = []
        else:
            self.lista_apps = lista_apps

    def get_feature_matrix(self):
        """Devuelve matriz de caracterÃ­sticas de los objetos App.

        Cada fila es una App, las columnas son sus caracterÃ­sticas
        numÃ©ricas (excepto 'success').

        Returns:
            list: Lista de listas con caracterÃ­sticas numÃ©ricas por App.
                  Retorna lista vacÃ­a si el dataset estÃ¡ vacÃ­o.
        """
        if not self.lista_apps:
            return []
        return [app.to_features()[:-1] for app in self.lista_apps]

    def get_target_vector(self):
        """Devuelve vector objetivo ('success') de los objetos App.

        Cada elemento es el valor 'success' de una aplicaciÃ³n.

        Returns:
            list: Lista de los valores 'success' por aplicaciÃ³n.
                  Retorna lista vacÃ­a si el dataset estÃ¡ vacÃ­o.
        """
        if not self.lista_apps:
            return []
        return [app.to_features()[-1] for app in self.lista_apps]

#### Pruebas a la clase AppDataset

In [40]:
# Uso normal
lista_apps = [
    App("FastChat", 10000, 12.5, 0.65, 1500, 1),
    App("FitTrack", 500, 5.0, 0.2, 50, 0),
    App("GameHub", 15000, 25.0, 0.75, 3000, 1),
    App("BudgetBuddy", 800, 6.5, 0.3, 80, 0),
    App("EduFlash", 12000, 18.0, 0.7, 2200, 1),
    App("NoteKeeper", 600, 4.0, 0.15, 30, 0)
]
obj_appdataset = AppDataset(lista_apps)
print(obj_appdataset.get_feature_matrix())
print(obj_appdataset.get_target_vector())

[[10000, 12.5, 0.65, 1500], [500, 5.0, 0.2, 50], [15000, 25.0, 0.75, 3000], [800, 6.5, 0.3, 80], [12000, 18.0, 0.7, 2200], [600, 4.0, 0.15, 30]]
[1, 0, 1, 0, 1, 0]


In [41]:
# uso la lista vacia
lista_apps = []
obj_appdataset = AppDataset(lista_apps)
print(obj_appdataset.get_feature_matrix())
print(obj_appdataset.get_target_vector())

[]
[]


In [42]:
# uso sin lista
obj_appdataset = AppDataset()
print(obj_appdataset.get_feature_matrix())
print(obj_appdataset.get_target_vector())

[]
[]


## DefiniciÃ³n de la clase SuccessPredictor

In [43]:
#!pip install --upgrade scikit-learn
#!pip install numpy==1.26.4
import numpy as np
import sklearn
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report

print(f"VersiÃ³n de scikit-learn: {sklearn.__version__}")
print(f"VersiÃ³n de NumPy: {np.__version__}")

VersiÃ³n de scikit-learn: 1.6.1
VersiÃ³n de NumPy: 1.26.4


In [44]:
class SuccessPredictor:
    """Predice la probabilidad de Ã©xito de una aplicaciÃ³n.

    Utiliza regresiÃ³n logÃ­stica para clasificar aplicaciones
    basÃ¡ndose en sus caracterÃ­sticas.
    """
    def __init__(self):
        """Inicializa el predictor con un modelo y un escalador."""
        self.model = LogisticRegression()
        self.scaler = StandardScaler()

    def train(self, dataset):
        """Entrena el modelo con los datos proporcionados.

        Args:
            dataset (AppDataset): Objeto AppDataset con datos de
                entrenamiento (caracterÃ­sticas y variable objetivo).
        """
        X = dataset.get_feature_matrix()
        y = dataset.get_target_vector()
        self.scaler.fit(X) # calcula avg, std de cada atributo
        X_scaled = self.scaler.transform(X) # escala los datos
        self.model.fit(X_scaled, y)

    def predict(self, nueva_app):
        """Predice si una nueva aplicaciÃ³n serÃ¡ exitosa (1) o no (0).

        Args:
            nueva_app (App): Objeto App con las caracterÃ­sticas a
                predecir.

        Returns:
            int: 1 si la aplicaciÃ³n se predice como exitosa, 0 en caso
                contrario.
        """
        nueva_app_atributos_normalizados = self.scaler.transform(
            [nueva_app.to_features()[:-1]]
        )
        return self.model.predict(nueva_app_atributos_normalizados)[0]

    def predict_proba(self, nueva_app):
        """Devuelve la probabilidad de que una nueva aplicaciÃ³n sea exitosa.

        Args:
            nueva_app (App): Objeto App con las caracterÃ­sticas a
                predecir.

        Returns:
            float: Probabilidad de Ã©xito de la aplicaciÃ³n (valor entre 0 y 1).
        """
        nueva_app_atributos_normalizados = self.scaler.transform(
            [nueva_app.to_features()[:-1]]
        )
        return self.model.predict_proba(nueva_app_atributos_normalizados)[0][1]


#### Pruebas a la clase SuccessPreditor

In [45]:
lista_apps = [
    App("FastChat", 10000, 12.5, 0.65, 1500, 1),
    App("FitTrack", 500, 5.0, 0.2, 50, 0),
    App("GameHub", 15000, 25.0, 0.75, 3000, 1),
    App("BudgetBuddy", 800, 6.5, 0.3, 80, 0),
    App("EduFlash", 12000, 18.0, 0.7, 2200, 1),
    App("NoteKeeper", 600, 4.0, 0.15, 30, 0)
]
obj_appdataset = AppDataset(lista_apps)
predictor = SuccessPredictor()
predictor.train(obj_appdataset)
print(predictor.model.coef_)
print(predictor.model.intercept_)
new_app = App("StudyBoost", 20000, 15.0, 0.5, 700)
predicted_success = predictor.predict(new_app)
prob = predictor.predict_proba(new_app)
print("Prediccion ->",predicted_success)
print(f"Â¿SerÃ¡ exitosa la app {new_app.app_name}? {'SÃ­' if predicted_success else 'No'}")
print(f"Probabilidad estimada de Ã©xito: {prob:.2f}")

[[0.62025599 0.4611371  0.64700619 0.54467896]]
[0.13464581]
Prediccion -> 1
Â¿SerÃ¡ exitosa la app StudyBoost? SÃ­
Probabilidad estimada de Ã©xito: 0.83
