In [None]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carica il dataset
df = pd.read_csv('../dataset/RAW_merged.csv')

# Preprocessing
df['ingredients'] = df['ingredients'].apply(lambda x: ' '.join(eval(x)))  # Trasforma la lista di ingredienti in una stringa
df['techniques'] = df['techniques_list'].apply(lambda x: ' '.join(eval(x)))  # Trasforma la lista di tecniche in una stringa

# Rappresentazione usando TF-IDF
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(df['ingredients'])
y = df['techniques']

# Split dei dati
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.9, random_state=42)

# Addestramento del modello
model = LogisticRegression()
model.fit(X_train, y_train)

# Predizione e valutazione
y_pred = model.predict(X_test)
print('Accuracy:', accuracy_score(y_test, y_pred))

In [5]:
new_ingredients = ['winter squash', 'mexican seasoning', 'mixed spice', 'honey', 'butter', 'olive oil', 'salt']

# Trasforma la lista di ingredienti in una stringa e poi in una rappresentazione TF-IDF
new_ingredients_str = ' '.join(new_ingredients)
new_ingredients_vec = vectorizer.transform([new_ingredients_str])

# Fai la predizione
predicted_techniques = model.predict(new_ingredients_vec)

print('Metodi di cottura predetti:', predicted_techniques)

Metodi di cottura predetti: ['bake']


In [9]:
new_ingredients = ['coffee', 'chocolate syrup', 'french vanilla flavored coffee creamer', 'sugar', 'ice cube']

# Trasforma la lista di ingredienti in una stringa e poi in una rappresentazione TF-IDF
new_ingredients_str = ' '.join(new_ingredients)
new_ingredients_vec = vectorizer.transform([new_ingredients_str])

# Fai la predizione
predicted_techniques = model.predict(new_ingredients_vec)

print('Metodi di cottura predetti:', predicted_techniques)

Metodi di cottura predetti: ['bake']
