In [1]:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
import fasttext
import re

In [2]:
fake = pd.read_csv('fake.csv')
fake.shape

(1339, 2)

In [3]:
non_fake = pd.read_csv('non-fake.csv')
non_fake = non_fake.sample(n=2000,random_state=10)

In [4]:
dataset = pd.concat([fake,non_fake])
dataset.sample(10)

Unnamed: 0,Review,Label
6903,"৮০ টাকায় ২ টা বার্গারলকডাউনের দিন শেষ,স্কুল/কল...",1
3867,পুরান ঢাকার নাজিরাবাজার গিয়ে এই আইসক্রিম যদি ন...,1
2094,খুব ই সুন্দর ইন্টেরিয়র নিয়ে দক্ষিণ বনশ্রী ত...,1
7125,#খাট্টামিঠা_ফুচকা বেশ কিছু মাস আগে বিভিন্ন ফুড...,1
6706,২০১৭ সালের দিকে যখন পাবুলাম মালিবাগ স্বপ্ন দোক...,1
336,আজ ওয়ারী পপিইস (পুরান) টায় খেলাম যা পুলিশ ফাঁড়...,1
55,‼️অফার ❗অফার ❗অফার ‼️\r\n১ টাকার বার্গারের অফা...,0
5925,শ্যামলী স্কয়ারের Burger Inn এর ৯৯/- 'র বার্গা...,1
3627,পসেটিভ রিভিও খিদা লাগছে?Location :Block:C Ho...,1
4250,বনানীর স্ট্রিটফুডগুলার মধ্যে সবচেয়ে বেশি মিস ক...,1


In [5]:
dataset.to_csv('bangla_food_review.csv',index=False)

In [6]:
data = pd.read_csv('bangla_food_review.csv')
data.sample(5)

Unnamed: 0,Review,Label
77,#Offer😍\r\n#এক_ঢিলে_দুই_পাখি😁\r\n#আমি_কালা_গলা...,0
2889,Negative reviewহাজীর বিরিয়ানী নাজিরাবাজার ১৬০ ...,1
3030,পজিটিভ রিভিউ সানশাইন ফুড ওয়ালড আজ শ্যামলী স...,1
539,👌👌ডিসকাউন্ট অফার 👌👌 \r\nঅফার তো আর কম খেলাম না...,0
667,"""পাশের বাসার আন্টি বলেছে প্রচুর খেতে হবে তাই প...",0


In [7]:
data.dropna(inplace=True)
data.shape

(3339, 2)

In [8]:
data.Label.replace(1,"Not_Fake",inplace=True)
data.Label.replace(0,"Fake",inplace=True)
data.sample(5)

Unnamed: 0,Review,Label
2532,"#Positive_reviewধানমন্ডি ৮/এ,(আলমাস এর পাশে), ...",Not_Fake
2918,পান্থপথে বেশ কিছু রেস্টুরেন্টেই রয়েছে অসাধারণ ...,Not_Fake
1381,অফিসের বস এর স্যালারি ট্রিট পেলাম Dhaka Steakh...,Not_Fake
282,here we go… my first try at this… a “short” & ...,Fake
3180,#positive_review ইফতার + ডিনার খেয়ে এলাম Taste...,Not_Fake


In [9]:
data["Label"] = "__label__" + data["Label"].astype(str)
data.sample(5)

Unnamed: 0,Review,Label
2384,মিটবক্স প্লেস The Meat Shack এর কথা। একবার না...,__label__Not_Fake
3104,Egg Dosa!!! *_*ধানমন্ডি 5 নাম্বার দামঃ মাত্র ৭...,__label__Not_Fake
1530,স্থান: দস্তরখান মিরপুর-৬খাবার: ১.মুরগিরর ঝালফ্...,__label__Not_Fake
2266,Cheese Loaded Honey Mustard #মাত্র_৯৯_তেই_পাব...,__label__Not_Fake
2062,রেড ভেলভেট কেক দিয়ে বাজিমাততার পছন্দের রেস্টু...,__label__Not_Fake


In [10]:
data["category_description"] = data["Label"] +" "+ data["Review"]
data.sample(5)

Unnamed: 0,Review,Label,category_description
2724,মেন্যু: ডাবল ইফতার প্ল্যাটার। সাথে দুই মগ মাঝা...,__label__Not_Fake,__label__Not_Fake মেন্যু: ডাবল ইফতার প্ল্যাটার...
3311,Burgerology Wariমাঝে মাঝেই বসুন্ধরা এলাকাও যাও...,__label__Not_Fake,__label__Not_Fake Burgerology Wariমাঝে মাঝেই ব...
2498,"আইটেম: সেট মেন্যু স্থান: রিলিস ফুড, শ্যামলী স্...",__label__Not_Fake,__label__Not_Fake আইটেম: সেট মেন্যু স্থান: রিল...
2072,কালাই রুটি খেতে রাজশাহী যাবেনকোনো দরকার নেই K...,__label__Not_Fake,__label__Not_Fake কালাই রুটি খেতে রাজশাহী যাবে...
883,ভালোবাসার আরেক নাম কাবাব স্টেশন ❤️\r\nআবারও চল...,__label__Fake,__label__Fake ভালোবাসার আরেক নাম কাবাব স্টেশন ...


In [11]:
def preprocess(sentence):
    sentence = re.sub("['।,]+",' ',sentence)
    sentence = re.sub(r'\n', ' ', sentence)
    sentence = re.sub(r'[ ]+', ' ', sentence)
    return sentence.strip().lower()

In [12]:
data.category_description = data.category_description.map(preprocess)
data.sample(5)
data.to_csv("food_review_after_preprocessing.csv",index=False)

In [13]:
data.category_description

0       __label__fake buy one get one mexican পাস্তা \...
1       __label__fake #review দেখে গেছিলাম\r ভাবতেই অব...
2       __label__fake #partner_platter ❤\r #বিগ_বাইট র...
3       __label__fake অথেনটিক পিজ্জা খেতে চাইলে এইটা ম...
4       __label__fake অনলি ফর ইউনিভার্সিটি কাপল স্টুডে...
                              ...                        
3334    __label__not_fake টেবিল ভর্তি খাবার দেখে চলে গ...
3335    __label__not_fake আহারে ভেলপুড়ি এক এর পর এক প...
3336    __label__not_fake আরাবিয়ান ফাস্টফুড ধানমন্ডির ...
3337    __label__not_fake বর্তমান সময়ের সেরা কাচ্চির ক...
3338    __label__not_fake আবার ফিরে যেতে হলো বানকার্স ...
Name: category_description, Length: 3339, dtype: object

In [14]:
train_set, test_set = train_test_split(data, test_size=0.2, random_state=42)

In [15]:
train_set.category_description

3255    __label__not_fake the pabulum #a_great_initiat...
2009    __label__not_fake #৯৯৳তান্দুরী আস্ত একটা মুরগি...
712                            __label__fake #paid review
2861    __label__not_fake কাচ্চি লাভারদের জন্য বর্তমান...
1506    __label__not_fake #১২১টাকা নাকি #২৬টাকা#২৬শে_ম...
                              ...                        
1095    __label__fake place: রাজমহল ফুডকোর্ট \r price:...
1130    __label__fake হ্যালো ভোজন প্রিয় নারায়ণগঞ্জ বা...
1294    __label__fake আচ্ছা! বাম চোখ লাফালে কি বিপদ আস...
860     __label__fake #brownie ❤ \r this fudgy brownie...
3174    __label__not_fake আনন্দময় ঈদের কাছাকাছি সময়ে র...
Name: category_description, Length: 2671, dtype: object

In [16]:
train_set.to_csv('food_review.train',columns=["category_description"],index=False,header=False)
test_set.to_csv('food_review.test',columns=["category_description"],index=False,header=False)

In [17]:
model = fasttext.train_supervised(input='food_review.train')


In [18]:
model.test("food_review.test")

(351, 0.9772079772079773, 0.9772079772079773)

In [19]:
# Step 2: Load the test data
test_data = []
with open('food_review.test', 'r', encoding='utf-8', errors='replace') as f:
    for line in f:
        if ' ' in line:  # Check if there is at least one space in the line
            label, text = line.split(' ', 1)
            test_data.append((label.strip(), text.strip()))
        else:
            print(f"Skipping line due to missing label/text: {line.strip()}")

In [20]:
# Step 3: Get predictions and compare with actual labels
true_negatives = []
true_positives = []
false_negatives = []
false_positives = []

for label, text in test_data:
    prediction = model.predict(text)[0][0]  # Get the predicted label
    
    if label == "__label__not_fake" and prediction == "__label__not_fake":
        true_negatives.append((label, text))
    elif label == "__label__fake" and prediction == "__label__fake":
        true_positives.append((label, text))
    elif label == "__label__fake" and prediction == "__label__not_fake":
        false_negatives.append((label, text))
    elif label == "__label__not_fake" and prediction == "__label__fake":
        false_positives.append((label, text))


In [21]:
model.predict('''○বান্ধুবিরা মিলে অনেক দিন পর বের হয়েছিলাম রিক্সায় ঘুরতে কিন্তুু ওরা খালি চাস্ন থাকে treat জন্য আমার আবার সুন্দর সুন্দর sun glass পরতে অনেক ভাল লাগে নতুন একটা চশমা পরে আজকে বের হয়েছিলাম বান্ধুবিরাও বললো েতাকে মানাইসে treat বাহানা আর খুইজা না পাওয়ায় বলতাসে নতুন glass কিনসস সেই খুশিতে treat দে 😒 কি আর করার অই দিন ফুড ব্যাংকে burger fiesta review দেক্লাম খুব reasonable price তাদের ফুডের আর খাবারও মজা আগেও তাদের ফুড আমি test করেছি 😋then burger fiesta গেলাম আমরা অডার করেছিলাম naga wings 🍗naga wings টা খুবই ঝাল ঝাল আমার খুব মজা লাগে জারা ঝাল খেতে পারেন must be try করবেন and সাথে অবশ্যই cold coffee নিতে হবে তাহলে test টা আরও মজা লাগে 😋 i love this burger fiesta s french fry 🍟🧡তাদের french fry টা খুবই crispy হয় and last one chicken sandwich as a good test 🥪 1.naga wings 4 pics/🍗99 tk. 2.chicken sandwich 4 pics🥪/99 tk. 3.french fry /100 tk 🍟 4.cold coffee 70 tk🍹''')

(('__label__not_fake',), array([0.91422081]))

In [22]:
model.predict('''অথেনটিক পিজ্জা খেতে চাইলে এইটা মাস্ট ট্রাই ❤️ ৪৯ টাকার অফার পিজ্জা খেতে গেছিলাম Pizza Station এ। অফার শেষ, তাই ভাবলাম এসেছি একটা পিজ্জা ট্রাই করেই যাই। অর্ডার করলাম তাদের Beef Supreme নামের পিজ্জাটা। আমার খাওয়া সেরা পিজ্জা গুলোর মধ্যে এইটা একটা। থিন ক্রাস্ট, হালকা চিজ আর উপরে বিফ কিমার টপিং। পুরাই প্রিমিয়াম একটা পিজ্জার ফিল দেয়। বিফ কিমায় হালকা নোনতা ও গোলমরিচ এর স্বাদ আর সাথে দেওয়া মেয়নিসের হালকা মিষ্টি একদম পারফেক্ট ব্যালেন্স। বেশ দারুন লাগে খেতে। যাদের একদম চিজে মাখামাখি পিজ্জা ভালো লাগে না, তারা Pizza Station এর পিজ্জা একবার ট্রাই করে দেখতে পারেন ❤️ দাম: ৪৯০ টাকা (১২") রেটিং: ৯/১০''')

(('__label__not_fake',), array([0.97985798]))

In [19]:
model.save_model('bangla_food_review.model')