In [1]:
!pip install pyspark



In [34]:
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql.functions import col, regexp_replace
from pyspark import SparkConf,SparkContext
from pyspark.sql.functions import split, concat_ws

In [35]:
data = pd.read_csv("dataset15k.csv")

In [36]:
data = data.drop("Summary", axis=1)
data = data.drop("img_m", axis=1)
data = data.drop("img_s", axis=1)
data = data.drop("img_l", axis=1)
data = data.drop("Category", axis=1)
data['isbn'] = pd.to_numeric(data['isbn'], errors='coerce',downcast='integer')
data = data.dropna()
data['isbn'] = data['isbn'].astype(int)
data['user_id'] = data["user_id"].astype(str).str[:4]
data['isbn'] = data["isbn"].astype(str).str[:9]
new_df = data.drop("location", axis=1)

In [37]:
new_df.to_csv("newdataset.csv", index=False)

In [38]:
d = pd.read_csv("newdataset.csv")

In [39]:
d.head()

Unnamed: 0.1,Unnamed: 0,user_id,age,isbn,rating,book_title,book_author,year_of_publication,publisher,Language,city,state,country
0,0,2,18.0,195153448,0,Classical Mythology,Mark P. O. Morford,2002.0,Oxford University Press,en,stockton,california,usa
1,1,8,34.7439,2005018,5,Clara Callan,Richard Bruce Wright,2001.0,HarperFlamingo Canada,en,timmins,ontario,canada
2,2,1140,49.0,2005018,0,Clara Callan,Richard Bruce Wright,2001.0,HarperFlamingo Canada,en,ottawa,ontario,canada
3,4,4138,34.7439,2005018,0,Clara Callan,Richard Bruce Wright,2001.0,HarperFlamingo Canada,en,sudbury,ontario,canada
4,5,6754,30.0,2005018,8,Clara Callan,Richard Bruce Wright,2001.0,HarperFlamingo Canada,en,toronto,ontario,canada


In [40]:
conf = SparkConf().setAppName("191805056_EsmanurDeli")
sc = SparkContext.getOrCreate(conf=conf)

In [41]:
dataset = sc.textFile("newdataset.csv")

In [42]:
header = dataset.first()

In [43]:
data = dataset.filter(lambda line: line != header)

In [44]:
num_books = data.count()
print("Number of Books: ", num_books)

Number of Books:  13656


Transform the data by splitting each record into fields.

In [45]:
book_fields = data.map(lambda lines: lines.split(","))

In [46]:
book_fields.first()

['0',
 '2',
 '18.0',
 '195153448',
 '0',
 'Classical Mythology',
 'Mark P. O. Morford',
 '2002.0',
 'Oxford University Press',
 'en',
 'stockton',
 'california',
 'usa']

Gerekli yerleri nümerik değere çevirme

In [47]:
isbn = book_fields.map(lambda fields:fields[3])

In [48]:
isbn_filtered = isbn.map(lambda x: int(x) if x.isdigit() else None).filter(lambda x: x is not None)

In [49]:
user_id = book_fields.map(lambda fields:fields[1])

In [50]:
user_id_filtered=user_id.map(lambda x: int(x) if x.isdigit() else None).filter(lambda x: x is not None)

In [51]:
rating = book_fields.map(lambda fields:fields[4])

In [52]:
rating_filtered = rating.map(lambda x: int(x) if x.isdigit() else None).filter(lambda x: x is not None)

In [53]:
user_id_filtered.take(3)

[2, 8, 1140]

In [54]:
rating.take(3)

['0', '5', '0']

In [55]:
book_ratings = data.map(lambda line: line.split(",")).map(lambda x: (x[6], int(x[4])))


In [56]:
average_ratings = book_ratings.reduceByKey(lambda x, y: (x + y) / 2)


In [57]:
for book, rating in average_ratings.collect():
    print(f"Book: {book}, Average Rating: {rating}")


Book: Mark P. O. Morford, Average Rating: 0
Book: Richard Bruce Wright, Average Rating: 6.53369140625
Book: E. J. W. Barber, Average Rating: 0
Book: Amy Tan, Average Rating: 1.6438236982113863
Book: Robert Cowley, Average Rating: 0.5
Book: Scott Turow, Average Rating: 0.0
Book: Sheila Heti, Average Rating: 2.5
Book: R. J. Kaiser, Average Rating: 5
Book: Jack Canfield, Average Rating: 5.421875
Book: Loren D. Estleman, Average Rating: 6
Book: Robert Hendrickson, Average Rating: 1.5
Book: Julia Oliver, Average Rating: 3.5
Book: John Grisham, Average Rating: 1.446900765421845
Book: Toni Morrison, Average Rating: 0.7931664225774198
Book: The Onion, Average Rating: 6.9735260009765625
Book: J. R. Parrish, Average Rating: 2.5
Book: Kathleen Duey, Average Rating: 6
Book: MICHAEL CRICHTON, Average Rating: 1.1030332792556412
Book: Rosamunde Pilcher, Average Rating: 3.0051557342651214
Book: Agatha Christie, Average Rating: 0.051239013671875
Book: Louis L'Amour, Average Rating: 3.42333984375
Book: 

Build recommendation engine using collaborative filtering.

In [58]:
from pyspark.mllib. recommendation import ALS # Alternating Least Squares 
from pyspark.mllib.recommendation import Rating
ratings = book_fields.map (lambda x: Rating(int(x[1]), int(x[3]), float(x[4])))

In [59]:
ratings.take(5)

[Rating(user=2, product=195153448, rating=0.0),
 Rating(user=8, product=2005018, rating=5.0),
 Rating(user=1140, product=2005018, rating=0.0),
 Rating(user=4138, product=2005018, rating=0.0),
 Rating(user=6754, product=2005018, rating=8.0)]

Use %70 of dataset for training, rest of them for testing.

In [99]:
training_data, test_data = ratings.randomSplit([0.7, 0.3])

In [61]:
training_data.take(10)

[Rating(user=2, product=195153448, rating=0.0),
 Rating(user=8, product=2005018, rating=5.0),
 Rating(user=1140, product=2005018, rating=0.0),
 Rating(user=8552, product=2005018, rating=0.0),
 Rating(user=9605, product=2005018, rating=0.0),
 Rating(user=1236, product=2005018, rating=9.0),
 Rating(user=1774, product=2005018, rating=0.0),
 Rating(user=2002, product=2005018, rating=8.0),
 Rating(user=2190, product=2005018, rating=7.0),
 Rating(user=2633, product=2005018, rating=6.0)]

In [62]:
training_data = training_data.map(lambda x: (x[0], x[1], int(x[2])))

In [63]:
training_data.take(10)

[(2, 195153448, 0),
 (8, 2005018, 5),
 (1140, 2005018, 0),
 (8552, 2005018, 0),
 (9605, 2005018, 0),
 (1236, 2005018, 9),
 (1774, 2005018, 0),
 (2002, 2005018, 8),
 (2190, 2005018, 7),
 (2633, 2005018, 6)]

Use ALS (Alternating Least Squares) for training recommendation model with last 4 digit
of your student number as a “seed”. Also change the parameters of ALS re-run the
algorithm for parameters “rank” (10, 50, 200), “iteration” (10, 50, 200) and “lambda”
(0.01, 0.1). 

In [64]:
from pyspark.mllib.evaluation import RegressionMetrics

seed = 5056
rank_values = [10, 50, 200]
iteration_values = [10, 50, 200]
lambda_values = [0.01, 0.1]

In [65]:
results = []


In [72]:
model1 = ALS.train(training_data,rank = 10, 
                   iterations = 10, 
                   lambda_ = 0.01,
                   seed = seed)

In [67]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model1.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': rank_values[0],
    'Iterations': iteration_values[0],
    'Lambda': lambda_values[0],
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 45.839624192966944
RMSE: 6.7704965986969485
-------------------------------


                                                                                

In [33]:
model2 = ALS.train(training_data,rank = 10, 
                   iterations = 50, 
                   lambda_ = 0.01,
                   seed = seed)

In [34]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model2.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 10,
    'Iterations': 50,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 30.579291596554214
RMSE: 5.529854572821442
-------------------------------


                                                                                

model3 = ALS.train(training_data,rank = 10, 
                   iterations = 200, #iterasyondan kaynaklı olabilir
                   lambda_ = 0.01,
                   seed = seed)

test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model3.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 10,
    'Iterations': 200,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

In [35]:
model4 = ALS.train(training_data,rank = 10, 
                   iterations = 10, 
                   lambda_ = 0.1,
                   seed = seed)

In [36]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model4.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 10,
    'Iterations': 10,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 24.278863756962583
RMSE: 4.927358699847473
-------------------------------


                                                                                

In [37]:
model5 = ALS.train(training_data,rank = 10, 
                   iterations = 50, 
                   lambda_ = 0.1,
                   seed = seed)

In [38]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model5.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 10,
    'Iterations': 50,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 22.520058668395368
RMSE: 4.745530388523012
-------------------------------




model6 = ALS.train(training_data,rank = 10, 
                   iterations = 200, #200 olunca sorun çıkarıyor
                   lambda_ = 0.1,
                   seed = seed)

test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model6.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 10,
    'Iterations': 200,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

In [39]:
model7 = ALS.train(training_data,rank = 50, 
                   iterations = 10, 
                   lambda_ = 0.01,
                   seed = seed)

In [40]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model7.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 50,
    'Iterations': 10,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 20.117511693757628
RMSE: 4.4852549195957225
-------------------------------


                                                                                

In [41]:
model8 = ALS.train(training_data,rank = 50, 
                   iterations = 50, 
                   lambda_ = 0.01,
                   seed = seed)

In [42]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model8.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 50,
    'Iterations': 50,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 19.044651944349276
RMSE: 4.364017867097851
-------------------------------


model9 = ALS.train(training_data,rank = 50, 
                   iterations = 200, 
                   lambda_ = 0.01,
                   seed = seed)

test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model9.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 50,
    'Iterations': 200,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

In [43]:
model10 = ALS.train(training_data,rank = 50, 
                   iterations = 10, 
                   lambda_ = 0.1,
                   seed = seed)

In [44]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model10.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 50,
    'Iterations': 10,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 19.512417757654568
RMSE: 4.417286243572469
-------------------------------


                                                                                

In [45]:
model11 = ALS.train(training_data,rank = 50, 
                   iterations = 50, 
                   lambda_ = 0.1,
                   seed = seed)

In [46]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model11.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 50,
    'Iterations': 50,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 19.281426710399106
RMSE: 4.3910621392095
-------------------------------


                                                                                

model12 = ALS.train(training_data,rank = 50, 
                   iterations = 200, 
                   lambda_ = 0.01,
                   seed = seed)

test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model12.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 50,
    'Iterations': 200,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

In [47]:
model13 = ALS.train(training_data,rank = 200, 
                   iterations = 10, 
                   lambda_ = 0.01,
                   seed = seed)

                                                                                

In [48]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model13.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 200,
    'Iterations': 10,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 18.801560218427237
RMSE: 4.336076592776843
-------------------------------


                                                                                

In [49]:
model14 = ALS.train(training_data,rank = 200, 
                   iterations = 50, 
                   lambda_ = 0.01,
                   seed = seed)

                                                                                

In [50]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model14.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 200,
    'Iterations': 50,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 18.773203386752513
RMSE: 4.33280548683558
-------------------------------




model15 = ALS.train(training_data,rank = 200, 
                   iterations = 200, 
                   lambda_ = 0.01,
                   seed = seed)

test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model15.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 200,
    'Iterations': 200,
    'Lambda': 0.01,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

In [51]:
model16 = ALS.train(training_data,rank = 200, 
                   iterations = 10, 
                   lambda_ = 0.1,
                   seed = seed)

                                                                                

In [52]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model16.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 200,
    'Iterations': 10,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")



Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 19.305439735330168
RMSE: 4.393795595533566
-------------------------------


                                                                                

In [53]:
model17 = ALS.train(training_data,rank = 200, 
                   iterations = 50, 
                   lambda_ = 0.1,
                   seed = seed)

                                                                                

In [54]:
test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model17.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 200,
    'Iterations': 50,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

[Stage 5408:>                                                       (0 + 2) / 2]                                                                                

Model Parameters: Rank=0.01, Iterations=10, Lambda=0.01
MSE: 19.274294182293882
RMSE: 4.3902498997544415
-------------------------------


model18 = ALS.train(training_data,rank = 200, 
                   iterations = 200, 
                   lambda_ = 0.1,
                   seed = seed)

test_user_product = test_data.map(lambda x: (x[0], x[1]))
predictions = model18.predictAll(test_user_product).map(lambda x: ((x[0], x[1]), x[2]))
rates_and_preds = test_data.map(lambda x: ((x[0], x[1]), x[2])).join(predictions)
mse = rates_and_preds.map(lambda x: (x[1][0] - x[1][1])**2).mean()
rmse = mse**0.5

result = {
    'Rank': 200,
    'Iterations': 200,
    'Lambda': 0.1,
    'MSE': mse,
    'RMSE': rmse
}
results.append(result)

print("Model Parameters: Rank={}, Iterations={}, Lambda={}".format(lambda_values[0], iteration_values[0], lambda_values[0]))
print("MSE:", mse)
print("RMSE:", rmse)
print("-------------------------------")

ALS ile tahminde bulunup (predict) bunu yan yana gelecek şekilde orijinal (gerçek değerler ile) değerlendirmeler ile karşılaştırması olmalı. En iyi model ile bunu yapıyoruz

In [83]:
test_data

[Rating(user=4138, product=2005018, rating=0.0),
 Rating(user=6754, product=2005018, rating=8.0),
 Rating(user=2109, product=2005018, rating=9.0),
 Rating(user=8, product=60973129, rating=0.0),
 Rating(user=1109, product=374157065, rating=10.0),
 Rating(user=1926, product=374157065, rating=8.0),
 Rating(user=2952, product=399135782, rating=9.0),
 Rating(user=3683, product=399135782, rating=0.0),
 Rating(user=1132, product=399135782, rating=0.0),
 Rating(user=1135, product=399135782, rating=0.0),
 Rating(user=1534, product=399135782, rating=0.0),
 Rating(user=1802, product=399135782, rating=0.0),
 Rating(user=1885, product=399135782, rating=0.0),
 Rating(user=1980, product=399135782, rating=7.0),
 Rating(user=2124, product=399135782, rating=8.0),
 Rating(user=2422, product=399135782, rating=0.0),
 Rating(user=2522, product=399135782, rating=0.0),
 Rating(user=2529, product=399135782, rating=8.0),
 Rating(user=5261, product=425176428, rating=8.0),
 Rating(user=9849, product=771074670, ra

In [100]:
# Test verilerini alın
test_data = test_data.collect()

# Her bir test verisi için tahmin yapın ve gerçek değerlerle karşılaştırın
for row in test_data:
    user_id = row.user
    item_id = row.product
    rating = row.rating
    
    if model1.userFeatures().lookup(user_id) and model1.productFeatures().lookup(item_id):
        # Tahmin yap
        predicted_rating = model1.predict(user_id, item_id)
        
        # Gerçek değer ile karşılaştır
        print("Gerçek Değer: {}, Tahmin: {}".format(rating, predicted_rating))

Gerçek Değer: 8.0, Tahmin: 8.164040876630203
Gerçek Değer: 7.0, Tahmin: 6.9893751721932595
Gerçek Değer: 0.0, Tahmin: 0.0017406587034818344
Gerçek Değer: 9.0, Tahmin: 8.978197785783918
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 9.0, Tahmin: 8.99896692895764
Gerçek Değer: 9.0, Tahmin: 8.992994953015454
Gerçek Değer: 0.0, Tahmin: -0.04792347092454463
Gerçek Değer: 8.0, Tahmin: -5.412691931826782
Gerçek Değer: 7.0, Tahmin: 6.903181626545695
Gerçek Değer: 10.0, Tahmin: 9.981166871630643
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.025403283399355825
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 10.0, Tahmin: 9.99707991820653
Gerçek Değer: 6.0, Tahmin: 6.012712827832546
Gerçek Değer: 7.0, Tahmin: 6.965615559277069
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0011093392121781231
Gerçek Değer: 0.0, Tahmin: -0.01411807060988951
Gerçek Değer: 0.0, Tahmin: -2.7721538884227357
Gerçek Değer: 0.0, Tahmin: -0.9364612904186145
Gerçek Değe

Gerçek Değer: 0.0, Tahmin: -4.012288600246713
Gerçek Değer: 8.0, Tahmin: 13.04609925397213
Gerçek Değer: 0.0, Tahmin: -0.13719629257192345
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 10.0, Tahmin: 9.460397552658975
Gerçek Değer: 0.0, Tahmin: -0.05605737071086736
Gerçek Değer: 0.0, Tahmin: -8.061388394184451
Gerçek Değer: 0.0, Tahmin: 0.010157303790903072
Gerçek Değer: 10.0, Tahmin: 9.977220727677942
Gerçek Değer: 0.0, Tahmin: -4.262425906353048
Gerçek Değer: 9.0, Tahmin: 8.996350362613946
Gerçek Değer: 6.0, Tahmin: 5.9991658185786
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 7.0, Tahmin: 6.9898357729543825
Gerçek Değer: 10.0, Tahmin: -4.962514924380089
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -3.451411919388491
Gerçek Değer: 0.0, Tahmin: 0.0003704083527567015
Gerçek Değer: 0.0, Tahmin: 3.865827460521908
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.00985556584254832
Gerçek Değer: 0.0, Tahmin: 0.001379286852133177
Gerçek Değ

Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 7.0, Tahmin: 6.9142526501990424
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.34991840155524856
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 2.469375954934044
Gerçek Değer: 0.0, Tahmin: 0.004510446761529563
Gerçek Değer: 8.0, Tahmin: 7.902002991264645
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 5.0, Tahmin: 4.938751909868088
Gerçek Değer: 0.0, Tahmin: 0.07090410956259907
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 5.0, Tahmin: 4.938751909868088
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.012164223780439132
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.15524994743882492
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.8056509660335905
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmi

Gerçek Değer: 6.0, Tahmin: 1.9657956195795747
Gerçek Değer: 0.0, Tahmin: -0.5651583307652164
Gerçek Değer: 0.0, Tahmin: 0.8830727653558372
Gerçek Değer: 6.0, Tahmin: 5.7508242554119064
Gerçek Değer: 0.0, Tahmin: 0.007161275034817116
Gerçek Değer: 0.0, Tahmin: 0.9829966088207398
Gerçek Değer: 0.0, Tahmin: 0.6724146146233743
Gerçek Değer: 1.0, Tahmin: 0.9672786378196103
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.003743969721181628
Gerçek Değer: 0.0, Tahmin: 0.003743969721181628
Gerçek Değer: 0.0, Tahmin: 0.003743969721181628
Gerçek Değer: 10.0, Tahmin: 0.1298228558265449
Gerçek Değer: 9.0, Tahmin: 8.262514890584061
Gerçek Değer: 0.0, Tahmin: -0.2829215358446162
Gerçek Değer: 0.0, Tahmin: 0.041775096503877895
Gerçek Değer: 0.0, Tahmin: 2.4608323490692077
Gerçek Değer: 0.0, Tahmin: 0.0016583166520103276
Gerçek Değer: 0.0, Tahmin: 0.0016163365359174175
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.029013021537007244
Gerçek Değer: 0.0, Tahmin: 0.056414184000505

Gerçek Değer: 7.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.31892381627808686
Gerçek Değer: 0.0, Tahmin: 0.31892381627808686
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 6.0, Tahmin: 5.857527833965385
Gerçek Değer: 0.0, Tahmin: 0.2105550336968074
Gerçek Değer: 0.0, Tahmin: 0.03052636896828742
Gerçek Değer: 0.0, Tahmin: 3.406838808478832
Gerçek Değer: 0.0, Tahmin: 0.3465115586397971
Gerçek Değer: 8.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.02220088455943403
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.4331061132914489
Gerçek Değer: 0.0, Tahmin: -0.23388327418933086
Gerçek Değer: 0.0, Tahmin: 0.0231164797964436
Gerçek Değer: 3.0, Tahmin: 1.009497796158822
Gerçek Değer: 0.0, Tahmin: 1.009497796158822
Gerçek Değer: 7.0, Tahmin: -1.1774469872221933
Gerçek Değer: 4.0, Tahmin: 3.785148867751608
Gerçek Değer: 7.0, Tahmin: 6.67175517982912
Gerçek Değer: 0.0, Tahmin: -0.016250476296109678
Gerçek Değer: 0.0, Tahmin: -0.005771743351486336
Gerçek Değe

Gerçek Değer: 10.0, Tahmin: 10.307973666093385
Gerçek Değer: 0.0, Tahmin: 4.5876157402702233e-05
Gerçek Değer: 8.0, Tahmin: -7.400426933588502
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.4412859959409987
Gerçek Değer: 0.0, Tahmin: -0.01850375851512398
Gerçek Değer: 0.0, Tahmin: -0.18862984380551762
Gerçek Değer: 7.0, Tahmin: -6.324044815929006
Gerçek Değer: 0.0, Tahmin: 2.2174513719305073
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.011098251298208517
Gerçek Değer: 7.0, Tahmin: 6.516956261009936
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.04171450250382458
Gerçek Değer: 0.0, Tahmin: -13.984672252549355
Gerçek Değer: 0.0, Tahmin: 0.12071195668851331
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.022089874321421288
Gerçek Değer: 0.0, Tahmin: -0.03790188914486592
Gerçek Değer: 0.0, Tahmin: 3.9936644386404634
Gerçek Değer: 0.0, Tahmin: 1.247842722011331
Gerçek Değer: 0.0, Tahmin: -0.0033316619014869264
Gerçek Değer: 0.0, Tahmin: 

Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 10.0, Tahmin: 9.989456436705472
Gerçek Değer: 10.0, Tahmin: 9.989217056472485
Gerçek Değer: 0.0, Tahmin: -7.191512703786884
Gerçek Değer: 0.0, Tahmin: -0.0003558404194574649
Gerçek Değer: 6.0, Tahmin: 5.968587194927779
Gerçek Değer: 10.0, Tahmin: 9.918353236955884
Gerçek Değer: 0.0, Tahmin: 0.037549023658826286
Gerçek Değer: 0.0, Tahmin: -0.2889053866949567
Gerçek Değer: 10.0, Tahmin: 1.2057775686365257
Gerçek Değer: 0.0, Tahmin: 5.00131832905581
Gerçek Değer: 9.0, Tahmin: 8.99582587021833
Gerçek Değer: 0.0, Tahmin: -0.01070874338869432
Gerçek Değer: 0.0, Tahmin: 0.01345861976754037
Gerçek Değer: 5.0, Tahmin: 4.934410438579479
Gerçek Değer: 9.0, Tahmin: 8.947866294857869
Gerçek Değer: 10.0, Tahmin: 9.904489683501087
Gerçek Değer: 10.0, Tahmin: 10.032702826212002
Gerçek Değer: 9.0, Tahmin: 9.017582911483643
Gerçek Değer: 0.0, Tahmin: 5.02157682622466
Gerçek Değer: 8.0, Tahmin: 7.976587419380742
Gerçek Değer: 10.0, Tahmin: 10.502525250501408
G

Gerçek Değer: 7.0, Tahmin: 6.958784871051826
Gerçek Değer: 0.0, Tahmin: -0.6959301566302445
Gerçek Değer: 10.0, Tahmin: 9.841431957425595
Gerçek Değer: 0.0, Tahmin: -0.008438738636019849
Gerçek Değer: 0.0, Tahmin: 1.0907446717810743
Gerçek Değer: 0.0, Tahmin: -0.10166343296680225
Gerçek Değer: 0.0, Tahmin: 0.008362393619561814
Gerçek Değer: 0.0, Tahmin: 5.878449353954886
Gerçek Değer: 0.0, Tahmin: -1.4775958508411342
Gerçek Değer: 0.0, Tahmin: -0.014549202492204483
Gerçek Değer: 0.0, Tahmin: -1.1500002286151998
Gerçek Değer: 0.0, Tahmin: -1.0523094918386509
Gerçek Değer: 8.0, Tahmin: 7.796314035901162
Gerçek Değer: 7.0, Tahmin: 6.981199966277669
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 9.0, Tahmin: 8.609370447840767
Gerçek Değer: 0.0, Tahmin: 0.030834938406278933
Gerçek Değer: 0.0, Tahmin: 0.003815882199876164
Gerçek Değer: 0.0, Tahmin: 0.31623019618396375
Gerçek Değer: 7.0, Tahmin: 6.795905684329477
Gerçek Değer: 0.0, Tahmin: 0.11109474068070391
Gerç

Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.30612608496500426
Gerçek Değer: 0.0, Tahmin: -0.01202385142625495
Gerçek Değer: 0.0, Tahmin: 13.4339328256234
Gerçek Değer: 0.0, Tahmin: -0.04891860085982014
Gerçek Değer: 0.0, Tahmin: 6.162355698761421
Gerçek Değer: 5.0, Tahmin: -2.561592701748003
Gerçek Değer: 10.0, Tahmin: 9.975716006478196
Gerçek Değer: 0.0, Tahmin: -0.049453220551173516
Gerçek Değer: 0.0, Tahmin: 0.04587903348717237
Gerçek Değer: 0.0, Tahmin: 0.04568960733728833
Gerçek Değer: 0.0, Tahmin: 0.04568960733728833
Gerçek Değer: 9.0, Tahmin: 5.440134250892055
Gerçek Değer: 9.0, Tahmin: 8.995747519698002
Gerçek Değer: 4.0, Tahmin: 0.07300931204298644
Gerçek Değer: 0.0, Tahmin: 0.000890010250784723
Gerçek Değer: 0.0, Tahmin: -0.16131145155855542
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.0025135240119362745
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 1.0, Tahmin: 0.9965243959718046
Gerçek Değer: 0.0, Tahmin: 0.012251308940987471
Gerçek Değer: 9

Gerçek Değer: 9.0, Tahmin: 8.99840395699012
Gerçek Değer: 0.0, Tahmin: 1.7122779639304682
Gerçek Değer: 4.0, Tahmin: 3.935618679209858
Gerçek Değer: 7.0, Tahmin: 6.990230634419806
Gerçek Değer: 7.0, Tahmin: 2.028062495042322
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0015643526594806278
Gerçek Değer: 0.0, Tahmin: -0.00593458987344242
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.23866099459515766
Gerçek Değer: 0.0, Tahmin: 0.0001083310179346153
Gerçek Değer: 7.0, Tahmin: 6.973367557269234
Gerçek Değer: 10.0, Tahmin: -1.0602908140034164
Gerçek Değer: 6.0, Tahmin: 5.975346830618575
Gerçek Değer: 9.0, Tahmin: 8.488703562113624
Gerçek Değer: 9.0, Tahmin: 4.083796973603005
Gerçek Değer: 0.0, Tahmin: -2.451547797687301
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.044027911574148426
Gerçek Değer: 8.0, Tahmin: 7.938135253276644
Gerçek Değer: 0.0, Tahmin: 0.33682223222574703
Gerçek Değer: 0.0, Tahmin: -0.3648977294456781
Gerçek Değer: 9.0, Tahmin: 

Gerçek Değer: 0.0, Tahmin: 0.05733967038325316
Gerçek Değer: 10.0, Tahmin: 8.953930352035968
Gerçek Değer: 0.0, Tahmin: 0.012038186361820635
Gerçek Değer: 9.0, Tahmin: 8.994215715864444
Gerçek Değer: 8.0, Tahmin: 7.9853616033361625
Gerçek Değer: 0.0, Tahmin: 0.44435717101427485
Gerçek Değer: 9.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.0027831198406458313
Gerçek Değer: 8.0, Tahmin: 7.997195287810031
Gerçek Değer: 10.0, Tahmin: -4.428712245025775
Gerçek Değer: 10.0, Tahmin: 9.902560327816994
Gerçek Değer: 10.0, Tahmin: 9.996494247219127
Gerçek Değer: 5.0, Tahmin: 4.995588235421138
Gerçek Değer: 8.0, Tahmin: 7.993500848403265
Gerçek Değer: 9.0, Tahmin: 8.936480746778251
Gerçek Değer: 10.0, Tahmin: 9.896304808460632
Gerçek Değer: 5.0, Tahmin: 5.128845775382844
Gerçek Değer: 10.0, Tahmin: 4.180574158853181
Gerçek Değer: 0.0, Tahmin: 0.32004340074979964
Gerçek Değer: 9.0, Tahmin: 8.992788649582018
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 0.0030683359146457256
Gerçek Değer

Gerçek Değer: 0.0, Tahmin: 9.326087706171265
Gerçek Değer: 0.0, Tahmin: 4.492780408370049
Gerçek Değer: 0.0, Tahmin: -1.4590330021400124
Gerçek Değer: 8.0, Tahmin: 0.8424129314899461
Gerçek Değer: 9.0, Tahmin: 8.972254190862316
Gerçek Değer: 0.0, Tahmin: -1.2390380257234246
Gerçek Değer: 3.0, Tahmin: 6.655890757086106
Gerçek Değer: 8.0, Tahmin: 6.655890757086106
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 3.0, Tahmin: 3.0214341950718726
Gerçek Değer: 7.0, Tahmin: 6.989548515341084
Gerçek Değer: 0.0, Tahmin: 0.026885239236795755
Gerçek Değer: 0.0, Tahmin: 0.4102212044850475
Gerçek Değer: 9.0, Tahmin: 8.901719034624993
Gerçek Değer: 8.0, Tahmin: 3.78798783929615
Gerçek Değer: 0.0, Tahmin: 0.00048043801488883986
Gerçek Değer: 1.0, Tahmin: 3.101041834243659
Gerçek Değer: 1.0, Tahmin: 1.0063356150903497
Gerçek Değer: 0.0, Tahmin: 0.0768043011785462
Gerçek Değer: 10.0, Tahmin: 10.082917951944694
Gerçek Değer: 8.0, Tahmin: 0.2830796348248388
Gerçek Değer: 9.0, Tahmin: 9.008725664437282
Gerçe

Gerçek Değer: 0.0, Tahmin: -1.6639353485031156
Gerçek Değer: 0.0, Tahmin: -2.136815768290111
Gerçek Değer: 8.0, Tahmin: 7.9898412586906495
Gerçek Değer: 0.0, Tahmin: 0.07135170747091202
Gerçek Değer: 0.0, Tahmin: 0.022770539842966286
Gerçek Değer: 0.0, Tahmin: 0.15216374065978844
Gerçek Değer: 5.0, Tahmin: 4.991635015785213
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: 4.78822393352085
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.007898449924479634
Gerçek Değer: 0.0, Tahmin: -22.404636919850056
Gerçek Değer: 0.0, Tahmin: 14.601306969539685
Gerçek Değer: 0.0, Tahmin: -0.5756718234393903
Gerçek Değer: 0.0, Tahmin: 0.024566185205885382
Gerçek Değer: 0.0, Tahmin: 2.1066802617656464
Gerçek Değer: 0.0, Tahmin: 0.5858161105153847
Gerçek Değer: 0.0, Tahmin: 0.0
Gerçek Değer: 0.0, Tahmin: -0.03496464429829649
Gerçek Değer: 8.0, Tahmin: 7.987476313418462
Gerçek Değer: 0.0, Tahmin: -0.2067504994058993
Gerçek Değer: 4.0, Tahmin: -27.319029779033535
Gerçek Değer: 0.0, Ta

ERROR:root:KeyboardInterrupt while sending command.
Traceback (most recent call last):
  File "/Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/py4j/java_gateway.py", line 1038, in send_command
    response = connection.send_command(command)
  File "/Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/py4j/clientserver.py", line 511, in send_command
    answer = smart_decode(self.stream.readline()[:-1])
  File "/Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/socket.py", line 705, in readinto
    return self._sock.recv_into(b)
KeyboardInterrupt


KeyboardInterrupt: 

In [None]:
def cosinesimilarity(item_id, a, b):
    dot = np. dot (a, b)
    norma = np.linalg.norm(a)
    normb = np.linalg.norm(b)
    cos = dot / (norma * normb)
    return item_id, cos

In [None]:
item id = 567
item_vector = model.productFeatures ().lookup(item_id)[0]

In [None]:
cosineSimilarity(item_id, item_vector, item_vector)