In [1]:
from google.colab import drive
drive.mount('/content/drive')


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [2]:
import os
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score, classification_report

In [3]:
# Veri setinin bulunduğu dizini belirtin
data_dir = "/content/drive/My Drive/Veri Seti"

# Veri setindeki dosyaların listesini alalım
file_list = os.listdir(data_dir)
data = {'lyrics': [], 'label': []}
# Dosyaları okuyup içeriğini görüntüleyelim
for file_name in file_list:
    with open(os.path.join(data_dir, file_name), 'r', encoding='utf-8') as file:
        content = file.read()
        data['lyrics'].append(content)
        if "Zararli" in file_name:
            data['label'].append(1)
        else:
            data['label'].append(0)
print(data)


{'lyrics': ["Kime ne kime ne kime ne\nKafam taşak gibi yine kime ne\nİçiyo'm her gün oğlum tabi ki\nSana ne sana ne sana ne\nKapım çalar polis mi o iyice\nBakmadan açayım deme sakın he\nSallanıyo' zincir ta sikime\nKime ne kime ne kime ne\nSallanıyo' zincir ta sikime (Zincir ta) Sikime-e-e (Sikime)\nCepler şişman dolu hep (Cepler şişman)\nBakar şaşkın gözler dolu hep (Şaşkın gözler)\nBizi tanıman gerek yanılma sakın sakın ha\nOnlar anca konuşur boş kafalar (Boş)\nBende hepsi var ne istiyo'n sen bahset ondan (Hadi lan)\nSıkı tut ağzını aman bişey kaçırma\nHerkes aynı yolda, benim yolum orda\nBana kafa tutma yok yok (Yok)\nSen anlamıcan, bunu belli oldu\nOyunum üst düzey çok çok (Çok)\nKime ne len varsa üstümde 100 gram dalga\nSana ne len varsa altımda üçyüzlük araç\nGeliyo'm len mahalleden sıfırdan bu anla\nEkibim sert bekliyo' hepsi bak telefonda\nKime ne kime ne kime ne\nKafam taşak gibi yine kime ne\nİçiyo'm her gün oğlum tabi ki\nSana ne sana ne sana ne\nKapım çalar polis mi o iyice

In [4]:
df = pd.DataFrame(data)
print(df.head(16))


                                               lyrics  label
0   Kime ne kime ne kime ne\nKafam taşak gibi yine...      1
1   Çek bi' duman bana, dön bunu\nHer tadan aklını...      1
2   Bu "G" ve de "i" ve de "Z" bide "GANG" ah\nSul...      1
3   Adana, Adana\nAdana merkez, patlıyo' herkes\nŞ...      1
4   Na-na-na-na-na-na, ha-ha-ah\nGece-geceler\nGec...      1
5   Ankara ayazı ruhumu keser\nBi' cebimde yok kap...      1
6   Ah, ah, ah, yeah\n(B-B-B-Bugy)\nEy\nYine günle...      1
7   Şşşt yavru alıyım mı seni?\nBana geçeriz ya, s...      1
8   Sarhoşum ah düşünmekten\nÖldüm ben ah hep sevm...      1
9   Bazen bana gelir, gider seni dert etmeler\nSen...      0
10  Zor, hangisi kolay ki?\nHer veda bırakır izini...      0
11  Umut yok bir ışık yok gözlerinde\nBen hala bek...      0
12  Alla beni, pulla beni, al koynuna, yâr\nGözüm ...      0
13  Sen gülünce güller açar, gülpembe\nBülbüller s...      0
14  Kaç yıl oldu saymadım köyden göçeli\nMevsimler...      0
15  Sen gittin gideli\nİ

In [5]:
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(df['lyrics'])

# Eğitim ve test veri setlerini oluşturalım
X_train, X_test, y_train, y_test = train_test_split(X, df['label'], test_size=0.2, random_state=42)

# Naive Bayes modelini eğitelim
model = MultinomialNB()
model.fit(X_train, y_train)

# Test veri seti üzerinde tahmin yapalım
y_pred = model.predict(X_test)

# Modelin performansını değerlendirelim
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

# Sınıflandırma raporunu gösterelim
print(classification_report(y_test, y_pred))

# Örnek bir şarkı sözü üzerinde modeli deneyelim
song_lyrics = ["Uçuyorum göklerde elimde esrar umuyorum konmam bir daha"]
song_vector = vectorizer.transform(song_lyrics)
prediction = model.predict(song_vector)
if prediction[0] == 1:
    print("Bu şarkı zararlı.")
else:
    print("Bu şarkı zararsız.")

Accuracy: 0.75
              precision    recall  f1-score   support

           0       0.50      1.00      0.67         1
           1       1.00      0.67      0.80         3

    accuracy                           0.75         4
   macro avg       0.75      0.83      0.73         4
weighted avg       0.88      0.75      0.77         4

Bu şarkı zararlı.


In [6]:
song_lyrics = ["Aşk bir yalan, ademle havvadan kalan"]
song_vector = vectorizer.transform(song_lyrics)
prediction = model.predict(song_vector)
if prediction[0] == 1:
    print("Bu şarkı zararlı.")
else:
    print("Bu şarkı zararsız.")

Bu şarkı zararsız.
