# **Predicción de precios futuros**

In [9]:
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import StandardScaler

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/productos_limpios.csv')

# Seleccionar las características relevantes para la predicción
features = ['Price_Before', 'Discounts %']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Price_Now']

# Escalar los datos de entrada
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Crear un modelo de regresión lineal
model = LinearRegression()

# Entrenar el modelo con los datos de entrenamiento
model.fit(X_train, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Calcular el error cuadrático medio (MSE)
mse = mean_squared_error(y_test, y_pred)
print('Error cuadrático medio:', mse)

# Solicitar datos interactivamente para realizar la predicción
input_price_before = float(input('Ingrese el precio anterior: '))
input_discounts = float(input('Ingrese el porcentaje de descuento: '))

# Crear un DataFrame con los datos de entrada
input_data = pd.DataFrame({
    'Price_Before': [input_price_before],
    'Discounts %': [input_discounts]
})

# Escalar los datos de entrada utilizando el mismo escalador
input_data_scaled = scaler.transform(input_data)

# Realizar la predicción utilizando el modelo entrenado
prediction = model.predict(input_data_scaled)

# Mostrar la predicción
print('La predicción del precio actual es:', prediction[0])

Error cuadrático medio: 106.34762623388265
La predicción del precio actual es: 328.41272223859295


* **Explicación detallada:**

1. **Importamos las bibliotecas necesarias:** `pandas` para manejar los datos, `LinearRegression` para el modelo de regresión lineal, `train_test_split` para dividir los datos en conjuntos de entrenamiento y prueba, `mean_squared_error` para calcular el error cuadrático medio y `StandardScaler` para escalar los datos.
2. Cargamos los datos desde el archivo `CSV` utilizando `pd.read_csv()`.
3. Seleccionamos las características relevantes para la predicción, en este caso, "`Price_Before`" y "`Discounts %`" y las asignamos a `X`.
4. Asignamos la variable objetivo "`Price_Now`" a `y`.
5. Escalamos los datos de entrada utilizando `StandardScaler()` para asegurar que todas las características tengan la misma escala.
6. Dividimos los datos en conjuntos de entrenamiento y prueba utilizando `train_test_split()`. Aquí, se asigna el 80% de los datos para entrenamiento y el 20% para prueba, y se utiliza una semilla (`random_state`) para garantizar la reproducibilidad de los resultados.
7. Creamos un objeto de modelo de regresión lineal utilizando `LinearRegression()`.
8. Entrenamos el modelo utilizando `fit()` con los datos de entrenamiento.
9. Realizamos predicciones en el conjunto de prueba utilizando `predict()`.
10. Calculamos el error cuadrático medio (`MSE`) utilizando `mean_squared_error()` comparando las etiquetas reales (`y_test`) con las predicciones (`y_pred`).
11. Solicitamos los datos de entrada interactivamente para realizar la predicción.
12. Creamos un `DataFrame` con los datos de entrada proporcionados.
13. Escalamos los datos de entrada utilizando el mismo escalador creado anteriormente para asegurar que los datos de entrada estén en la misma escala que los datos utilizados para entrenar el modelo.
14. Realizamos la predicción del precio actual utilizando `predict()` con los datos de entrada escalados.
Mostramos la predicción resultante.

# **Predicción de disponibilidad de stock**

In [12]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/productos_limpios.csv')

# Seleccionar las características relevantes para la predicción
features = ['Price_Now', 'Price_Before', 'Discounts %', 'Rating', 'Voters', 'Qualification %']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Stock']

# Escalar los datos de entrada
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Crear un modelo de regresión logística con solver 'liblinear' y max_iter=1000
model = LogisticRegression(solver='liblinear', max_iter=1000)

# Entrenar el modelo con los datos de entrenamiento
model.fit(X_train, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print('Precisión del modelo:', accuracy)

# Solicitar datos interactivamente para realizar la predicción
input_data = pd.DataFrame({
    'Price_Now': [float(input('Ingrese el precio actual: '))],
    'Price_Before': [float(input('Ingrese el precio anterior: '))],
    'Discounts %': [float(input('Ingrese el porcentaje de descuento: '))],
    'Rating': [float(input('Ingrese la calificación: '))],
    'Voters': [int(input('Ingrese el número de votantes: '))],
    'Qualification %': [float(input('Ingrese el porcentaje de calificación: '))],
})

# Escalar los datos de entrada utilizando el mismo escalador
input_data_scaled = scaler.transform(input_data)

# Realizar la predicción de disponibilidad de stock utilizando el modelo entrenado
prediction = model.predict(input_data_scaled)

# Mostrar la predicción
print('La predicción de disponibilidad de stock es:', prediction[0])

Precisión del modelo: 0.46634281748785567
La predicción de disponibilidad de stock es: Con stock completo


1. **Preparación de los datos:**

* Cargar los datos desde el archivo `CSV` utilizando `pd.read_csv()`.
* Seleccionar las características relevantes para la predicción, como '`Price_Now`', '`Price_Before`', '`Discounts %`', '`Rating`', '`Voters`' y '`Qualification %`', y asignarlas a `X`.
* Seleccionar la columna de la variable objetivo '`Stock`' y asignarla a `y`.

2. **División de los datos en conjuntos de entrenamiento y prueba:**

* Utilizar `train_test_split()` para dividir los datos en conjuntos de entrenamiento y prueba. Asignar el 80% de los datos para entrenamiento y el 20% para prueba. Utilizar una semilla (`random_state`) para garantizar la reproducibilidad de los resultados.

3. **Modelo matemático:**

* Crear un modelo de clasificación, como la Regresión Logística, utilizando `LogisticRegression()`.
* Entrenar el modelo utilizando `fit()` con los datos de entrenamiento.

4. **Realización de predicciones:**

* Realizar predicciones en el conjunto de prueba utilizando `predict()`.

5. **Evaluación del modelo:**

* Calcular la precisión del modelo utilizando `accuracy_score()` comparando las etiquetas reales (`y_test`) con las predicciones (`y_pred`).

6. **Predicción interactiva:**

* Solicitar los datos de entrada interactivamente para realizar la predicción.
* Crear un DataFrame con los datos de entrada proporcionados.
* Realizar la predicción de disponibilidad de stock utilizando `predict()` con los datos de entrada.

# **Predicción de calificación de los productos**

In [16]:
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import StandardScaler

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/productos_limpios.csv')

# Seleccionar las características relevantes para la predicción
features = ['Price_Now', 'Price_Before', 'Discounts %', 'Voters', 'Qualification %']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Rating']

# Escalar los datos de entrada
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Crear un modelo de regresión lineal
model = LinearRegression()

# Entrenar el modelo con los datos de entrenamiento
model.fit(X_train, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = model.predict(X_test)

# Calcular el error cuadrático medio (MSE)
mse = mean_squared_error(y_test, y_pred)
print('Error cuadrático medio:', mse)

# Solicitar datos interactivamente para realizar la predicción
input_data = pd.DataFrame({
    'Price_Now': [float(input('Ingrese el precio actual: '))],
    'Price_Before': [float(input('Ingrese el precio anterior: '))],
    'Discounts %': [float(input('Ingrese el porcentaje de descuento: '))],
    'Voters': [int(input('Ingrese el número de votantes: '))],
    'Qualification %': [float(input('Ingrese el porcentaje de calificación: '))],
})

# Escalar los datos de entrada utilizando el mismo escalador
input_data_scaled = scaler.transform(input_data)

# Realizar la predicción de calificación utilizando el modelo entrenado
prediction = model.predict(input_data_scaled)

# Mostrar la predicción
print('La predicción de calificación es:', prediction[0])

Error cuadrático medio: 2.390259491617795e-31
La predicción de calificación es: 4.4


# **Predicción de la categoría de los productos**

In [22]:
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/productos_limpios.csv')

# Seleccionar las características relevantes para la predicción
features = ['Price_Now', 'Price_Before', 'Discounts %', 'Rating', 'Voters', 'Qualification %']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Category']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar los datos de entrada
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Crear un modelo de regresión logística
model = LogisticRegression(max_iter=100000)

# Entrenar el modelo con los datos de entrenamiento
model.fit(X_train_scaled, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = model.predict(X_test_scaled)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print('Precisión del modelo:', accuracy)

# Solicitar datos interactivamente para realizar la predicción
input_data = {}
for feature in features:
    input_value = input(f"Ingrese el valor de {feature}: ")
    input_data[feature] = float(input_value)

# Crear un DataFrame con los datos de entrada
input_df = pd.DataFrame(input_data, index=[0])

# Escalar los datos de entrada
input_scaled = scaler.transform(input_df)

# Realizar la predicción utilizando el modelo entrenado
prediction = model.predict(input_scaled)

# Mostrar la predicción
print('La categoría del producto es:', prediction[0])

Precisión del modelo: 0.3199167244968772
La categoría del producto es: HP
