<a href="https://colab.research.google.com/github/luismiguelcasadodiaz/IBM_SkillsBuild_IA_325/blob/main/IA_325_py_cod_ex_33_s.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Recomendador de lenguajes de programación

##🧠 Proyecto: ¿Qué lenguaje de programación debo usar?

Imagina que trabajas como consultor de software para una aceleradora de startups. Tu tarea es desarrollar un sistema inteligente que, en base a ciertas características de un nuevo proyecto tecnológico, recomiende el lenguaje de programación más adecuado.

Para ello, cuentas con un histórico de proyectos clasificados según el lenguaje usado: **Python, JavaScript, Java o C++**. Cada proyecto tiene las siguientes características numéricas:

+ velocidad: qué tan rápido debe ser el desarrollo (0.0 a 1.0)
+ mantenimiento: importancia del mantenimiento a largo plazo (0.0 a 1.0)
+ libs: disponibilidad de librerías relevantes para el proyecto (0.0 a 1.0)
+ tipo_app: tipo de aplicación:

  + 0 = Ciencia de Datos
  + 1 = Aplicación Web
  + 2 = Sistema Embebido

+ rendimiento: necesidad de alto rendimiento (0.0 a 1.0)

Tu tarea consiste en:

## ✅ Objetivo

  + 1.- Crear una clase llamada LanguagePredictor que Use un Random Forest Classifier de sklearn.ensemble para entrenarse con un conjunto de datos sintético.
    + Métodos:
      + .train(X, y) que entrene el modelo.

      + .predict(features) que devuelva el lenguaje recomendado como cadena ("Python", "JavaScript", "Java", o "C++").

  + 2.- Crear una función generate_dataset(n_samples=100) que Genere n_samples ejemplos de proyectos con características aleatorias.

    Asigne un lenguaje de programación como etiqueta usando reglas simples, por ejemplo:

      + Si el rendimiento es alto (> 0.8) y el tipo de app es sistema embebido (tipo_app == 2), usar C++.

      + Si el mantenimiento es alto (> 0.7) y se trata de una aplicación web (tipo_app == 1), usar Java.

      + Si hay muchas librerías disponibles (> 0.6) y es un proyecto de ciencia de datos (tipo_app == 0), usar Python.

      + En otros casos, usar JavaScript como opción generalista.



## 🧪 Ejemplo de uso
```python

# Generar datos y entrenar
X, y = generate_dataset()
predictor = LanguagePredictor()
predictor.train(X, y)

# Crear un proyecto nuevo
new_project = np.array([0.7, 0.9, 0.5, 1, 0.6])  # Características del proyecto

# Predecir lenguaje ideal
pred = predictor.predict(new_project)
print(f"Lenguaje recomendado para el nuevo proyecto: {pred}")

```

## Salida esperada

Lenguaje recomendado para el nuevo proyecto: JavaScript


## Importacion de librerías

In [51]:
import numpy as np
from sklearn.ensemble import RandomForestClassifier

## Definición de la función generate_dataset

In [52]:
def generate_dataset(n_samples=100):
    """
    Genera un conjunto de datos sintético para la recomendación de lenguajes de programación.

    Args:
        n_samples (int): El número de muestras (proyectos) a generar. Por defecto es 100.

    Returns:
        tuple: Una tupla que contiene dos elementos:
            - X (list): Una lista de listas, donde cada lista interna representa
              las características de un proyecto (velocidad, mantenimiento, libs, tipo_app, rendimiento).
            - y (list): Una lista de cadenas, donde cada cadena es el lenguaje de
              programación recomendado para el proyecto correspondiente en X.
    """
    X = []
    y = []
    velocities = np.random.uniform(0.0, 1.0, n_samples)
    maintenances = np.random.uniform(0.0, 1.0, n_samples)
    libs = np.random.uniform(0.0, 1.0, n_samples)
    type_apps = np.random.randint(0, 3, n_samples)
    performances = np.random.uniform(0.0, 1.0, n_samples)
    lenguajes = []
    for i in range(n_samples):
        if performances[i] > 0.8 and type_apps[i] == 2:
            lenguajes.append("C++")
        elif maintenances[i] > 0.7 and type_apps[i] == 1:
            lenguajes.append("Java")
        elif libs[i] > 0.6 and type_apps[i] == 0:
            lenguajes.append("Python")
        else:
            lenguajes.append("JavaScript")
        X.append([velocities[i], maintenances[i], libs[i], type_apps[i], performances[i]])
        y.append(lenguajes[i])
    return X, y

In [53]:
X, y = generate_dataset(3)

In [54]:
print(X)
print(y)

[[np.float64(0.7329599417040279), np.float64(0.9290134083284516), np.float64(0.11208874968525084), np.int64(0), np.float64(0.6398656277850663)], [np.float64(0.8278696597711317), np.float64(0.663287972611895), np.float64(0.38809736178505627), np.int64(2), np.float64(0.9208629818823221)], [np.float64(0.01677547732368656), np.float64(0.042251387019075826), np.float64(0.8070592186813311), np.int64(2), np.float64(0.5060725773892707)]]
['JavaScript', 'C++', 'JavaScript']


## Definción de clase LanguagePredictor

In [55]:
class LanguagePredictor:
    """
    Clase para predecir el lenguaje de programación recomendado para un proyecto
    basado en sus características. Utiliza un modelo Random Forest Classifier.
    """
    def __init__(self):
        """
        Inicializa la clase LanguagePredictor.

        Atributos:
            model: El modelo Random Forest Classifier (inicialmente None).
        """
        self.model = None

    def train(self, X, y):
        """
        Entrena el modelo Random Forest Classifier con los datos proporcionados.

        Args:
            X (list): Lista de listas, donde cada lista interna son las características de un proyecto.
            y (list): Lista de cadenas, donde cada cadena es el lenguaje de programación correspondiente.

        Raises:
            ValueError: Si el modelo ya ha sido entrenado.
        """
        if self.model is None:
            self.model = RandomForestClassifier(n_estimators=80, random_state=42)
            self.model.fit(X, y)
        else:
            raise ValueError("Modelo ya entrenado")

    def predict(self, features):
        """
        Predice el lenguaje de programación para un nuevo proyecto.

        Args:
            features (np.array): Un array numpy con las características del nuevo proyecto.

        Returns:
            str: El lenguaje de programación recomendado como cadena.

        Raises:
            ValueError: Si el modelo no ha sido entrenado.
        """
        if self.model is None:
            raise ValueError("Modelo no entrenado")
        else:
            return self.model.predict([features])[0] # Se añade [0] para devolver solo la cadena

## Ejemplo de uso

In [56]:
# Generar datos y entrenar
X, y = generate_dataset()
predictor = LanguagePredictor()
predictor.train(X, y)

# Crear un proyecto nuevo
new_project = np.array([0.7, 0.9, 0.5, 1, 0.6])  # Características del proyecto

# Predecir lenguaje ideal
pred = predictor.predict(new_project)
print(f"Lenguaje recomendado para el nuevo proyecto: {pred}")

Lenguaje recomendado para el nuevo proyecto: Java
