In [22]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.metrics import classification_report
from sklearn.preprocessing import StandardScaler
from sklearn.feature_extraction.text import TfidfVectorizer
import joblib

In [23]:
df = pd.read_csv("Lyrics_Emotion.csv")

In [24]:
df.head()

Unnamed: 0,index,Song name,type,artist,lyrics
0,1,नीले नीले अम्बर पर,romantic,किशोर कुमार,नीले नीले अम्बर पर चाँद जब आये प्यार बरसाए हमक...
1,2,अक्कड़ बक्कड़,party,बादशाह,अक्कड़ बक्कड़ बॉम्बे बो पुरे रात के बज गए प...
2,3,अखियाँ,sad,पोपोन,ओ थक गेया अँखियाँ ओ जग्ग दियाँ अखियाँ माहियाँ ...
3,4,अंग से अंग लगाना,romantic,"अलका याग्निक, बिनोद राठौड़, सुदेश भोसले",अरे जो जी में आए अरे जो जी में आए तुम आज कर ल...
4,5,अगर ज़िन्दगी हो,romantic,आशा भोसले,अगर ज़िन्दगी हो तो तेरे संग हो अगर ज़िन्दगी हो...


In [25]:
df = df[['lyrics','type']]
df.columns = ['lyrics','emotion']

In [26]:
df.dropna(subset=['lyrics','emotion'],inplace=True)

In [27]:
df['lyrics'] = df['lyrics'].str.lower()

In [28]:
df

Unnamed: 0,lyrics,emotion
0,नीले नीले अम्बर पर चाँद जब आये प्यार बरसाए हमक...,romantic
1,अक्कड़ बक्कड़ बॉम्बे बो पुरे रात के बज गए प...,party
2,ओ थक गेया अँखियाँ ओ जग्ग दियाँ अखियाँ माहियाँ ...,sad
3,अरे जो जी में आए अरे जो जी में आए तुम आज कर ल...,romantic
4,अगर ज़िन्दगी हो तो तेरे संग हो अगर ज़िन्दगी हो...,romantic
...,...,...
788,विंटर का महीना उस पर तुझ जैसी हसीना बोलो फिर ...,party
789,आई अब की साल दिवाली मुंह पर अपने खून मले आई अ...,romantic
790,होंठों से छू लो तुम मेरा गीत अमर कर दो होंठों ...,romantic
791,चलो सहेली चलो रे साथी चलो सहेली चलो रे साथी ये...,party


In [29]:
vectorizer = TfidfVectorizer(stop_words='english',max_features=5000, ngram_range=(1, 2))
x = vectorizer.fit_transform(df['lyrics'])

In [30]:
y = df['emotion']

In [31]:
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=42)

In [32]:
model = LogisticRegression(solver='lbfgs',max_iter=1000, class_weight='balanced')
model.fit(x_train, y_train)

In [33]:
y_pred = model.predict(x_test)

In [34]:
print("Classification Repoet:\n", classification_report(y_test, y_pred))

Classification Repoet:
               precision    recall  f1-score   support

       party       0.60      0.78      0.68        27
    romantic       0.68      0.64      0.66        91
         sad       0.44      0.41      0.42        41

    accuracy                           0.60       159
   macro avg       0.57      0.61      0.59       159
weighted avg       0.60      0.60      0.60       159



In [37]:
sample = ["हम्म आ हा हा हा होशवालों को खबर "]
sample_vec = vectorizer.transform(sample)
predicted = model.predict(sample_vec)[0]
print("Predicted Emotion:", predicted)

Predicted Emotion: sad


In [36]:
probs = model.predict_proba(sample_vec)[0]
for emotion, prob in zip(model.classes_, probs):
    print(f"{emotion}: {prob:.2f}")

party: 0.31
romantic: 0.37
sad: 0.32


In [17]:
joblib.dump(model, 'Lyric_Emotion_model.pkl')
joblib.dump(vectorizer, 'Lyric_Emotion_vectorizer.pkl')

['Lyric_Emotion_vectorizer.pkl']