In [11]:
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
import pandas as pd

# Veri setini hazırla
ozetler = ['Bir grup cesur insan, karanlık bir ormanda yaşayan bir canavara karşı mücadele eder.', 'Bir adam, sevdiği kadını kurtarmak için zaman yolculuğuna çıkar.', 'Bir bilim adamı, uzaylılarla dolu bir gezegene düşer ve hayatta kalmak için mücadele eder.']
emojiler = ['👹', '⏰', '👽']
df = pd.DataFrame({'Özet': ozetler, 'Emoji': emojiler})

# Öznitelikleri ve hedef değişkeni belirle
cv = CountVectorizer()
X = cv.fit_transform(df['Özet'])
y = df['Emoji']

# Modeli oluştur ve eğit
model = MultinomialNB()
model.fit(X, y)

# Yeni bir film özeti ile emoji tahmini yap
new_ozet = 'Selamlar, bu bir deneme mesajıdır.'
X_new = cv.transform([new_ozet])
y_pred = model.predict(X_new)

# Tahmin edilen emojiyi yazdır
print(y_pred)


['👹']


In [52]:
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
import pandas as pd

# Veri setini hazırla
ozetler = [['live', 'two', 'mob', 'hitmen', 'boxer', 'gangster', 'wife', 'pair', 'diner', 'bandits', 'intertwine', 'four', 'tales', 'violence', 'redemption'],
           ['live', 'two', 'mob', 'hitmen', 'boxer', 'gangster', 'wife', 'pair', 'diner', 'bandits', 'intertwine', 'four', 'tales', 'violence', 'redemption'],
           ['gandalf', 'aragorn', 'lead', 'world', 'men', 'saurons', 'army', 'draw', 'gaze', 'frodo', 'sam', 'approach', 'mount', 'doom', 'one', 'ring'],
           ['germanoccupied', 'poland', 'world', 'war', 'ii', 'industrialist', 'oskar', 'schindler', 'gradually', 'become', 'concern', 'jewish', 'workforce', 'witness', 'persecution', 'nazis']]
emojiler = ['🔫','🥊','🧙‍♂️','🎥']
df = pd.DataFrame({'Özet': ozetler, 'Emoji': emojiler})

# Öznitelikleri ve hedef değişkeni belirle
cv = CountVectorizer()
X = cv.fit_transform(df['Özet'].apply(lambda x: ' '.join(x)))
y = df['Emoji']

# Modeli oluştur ve eğit
model = MultinomialNB()
model.fit(X, y)



# Yeni bir film özeti ile emoji tahmini yap
new_ozet = [['live', 'poland', 'selamlar']]
X_new = cv.transform([' '.join(new_ozet[0])])
y_pred = model.predict(X_new)

# Tahmin edilen emojiyi yazdır
print(y_pred) 


['🔫']


In [61]:
import numpy as np

# Yeni bir film özeti ile sınıf olasılıklarını tahmin et
new_ozet = [['live', 'poland', 'selamlar']]
X_new = cv.transform([' '.join(new_ozet[0])])
y_proba = model.predict_proba(X_new)

# Her bir sınıf için olasılıkları sırala
top_5_idx = np.argsort(-y_proba, axis=1)[:, :5]
top_5_proba = np.array([y_proba[i, idx] for i, idx in enumerate(top_5_idx)])
top_5_classes = np.array([model.classes_[idx] for idx in top_5_idx])

# En yüksek 5 olasılıklı sınıfları ve ilgili olasılıkları yazdır
for i in range(len(top_5_classes)):
    print(f"Örnek {i+1}:")
    for j in range(len(top_5_classes[i])):
        print(f"\tSınıf: {top_5_classes[i][j]}, Olasılık: {top_5_proba[i][j]:.4f}")


Örnek 1:
	Sınıf: 🔫, Olasılık: 0.2897
	Sınıf: 🥊, Olasılık: 0.2897
	Sınıf: 🎥, Olasılık: 0.2804
	Sınıf: 🧙‍♂️, Olasılık: 0.1402


In [3]:
import pandas as pd

# Film özetleri ve uygun emojiler
ozetler = ['Bir grup cesur insan, karanlık bir ormanda yaşayan bir canavara karşı mücadele eder.', 'Bir adam, sevdiği kadını kurtarmak için zaman yolculuğuna çıkar.', 'Bir bilim adamı, uzaylılarla dolu bir gezegene düşer ve hayatta kalmak için mücadele eder.']
emojiler = ['👹', '⏰', '👽']

# Veri setini oluştur
df = pd.DataFrame({'Özet': ozetler, 'Emoji': emojiler})

# Veri setini yazdır
print(df)


                                                Özet Emoji
0  Bir grup cesur insan, karanlık bir ormanda yaş...     👹
1  Bir adam, sevdiği kadını kurtarmak için zaman ...     ⏰
2  Bir bilim adamı, uzaylılarla dolu bir gezegene...     👽


In [5]:
import re
import nltk
from nltk.corpus import stopwords
nltk.download('stopwords')

# Küçük harfe çevirme
df["Overview"] = df["Overview"].str.lower()

# Noktalama işaretlerini kaldırma
df["Overview"] = df["Overview"].apply(lambda x: re.sub(r'[^\w\s]', '', x))

# Stop word'leri çıkarma
stop_words = set(stopwords.words('english'))
df["Overview"] = df["Overview"].apply(lambda x: " ".join(word for word in x.split() if word not in stop_words))

# Tokenizasyon
df["Overview"] = df["Overview"].apply(lambda x: x.split())

# Lemmatization
nltk.download('wordnet')
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()

df["Overview"] = df["Overview"].apply(lambda x: [lemmatizer.lemmatize(word, pos='v') for word in x])
df.head()


[nltk_data] Downloading package stopwords to
[nltk_data]     /Users/mustafayanar/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!
[nltk_data] Downloading package wordnet to
[nltk_data]     /Users/mustafayanar/nltk_data...


Unnamed: 0,Overview
0,"[two, imprison, men, bond, number, years, find..."
1,"[organize, crime, dynastys, age, patriarch, tr..."
2,"[menace, know, joker, wreak, havoc, chaos, peo..."
3,"[early, life, career, vito, corleone, 1920s, n..."
4,"[jury, holdout, attempt, prevent, miscarriage,..."


In [7]:
df.head()
df.to_csv("imdb_overviews_preprocessed.csv", index=False)

In [3]:
import pandas as pd

df = pd.read_csv("imdb_overviews.csv", delimiter="\t")
df.head()

Unnamed: 0,Overview
0,Two imprisoned men bond over a number of years...
1,An organized crime dynasty's aging patriarch t...
2,When the menace known as the Joker wreaks havo...
3,The early life and career of Vito Corleone in ...
4,A jury holdout attempts to prevent a miscarria...


In [1]:
import pandas as pd

# CSV dosyasını yükle
df = pd.read_csv("imdb_top_1000.csv")

# Sadece "Overview" sütununu seç
df = df[["Overview"]]

# Yeni dosyayı kaydet
df.to_csv("imdb_overviews.csv", index=False)

🧑‍🌾,🏡,🔢,👥,👣,🛣️,🧨,💪,🏆,🌍,🌑
elimde böyle emojilerden oluşan bir array var ve şöyle bir yazı var
"['meek', 'hobbit', 'shire', 'eight', 'companion', 'set', 'journey', 'destroy', 'powerful', 'one', 'ring', 'save', 'middleearth', 'dark', 'lord', 'sauron']"
bana emoji arrayi kadar satırlık 2 sütunlu bir dataframe oluşturur musun soldaki sutünda hep o yazı olacak şekilde bunun python kodunu istiyorum

In [91]:
import pandas as pd

emojis = ['🧑‍🌾', '🏡', '🔢', '👥', '👣', '🛣️', '🧨', '💪', '🏆', '🌍', '🌑']
words = ['meek', 'hobbit', 'shire', 'eight', 'companion', 'set', 'journey', 'destroy', 'powerful', 'one', 'ring', 'save', 'middleearth', 'dark', 'lord', 'sauron']

data = {'Emoji': emojis, 'Words': [", ".join(words) for i in range(len(emojis))]}
df = pd.DataFrame(data)

# CSV dosyasına ekle
df.to_csv('deneme.csv', mode='a', header=False, index=False)


In [102]:
import pandas as pd
import csv

with open('input.csv', newline='') as csvfile:
    data = list(csv.reader(csvfile))[0]
    words = [w.strip("' ") for w in data]

emojis = []
while True:
    emoji_input = input("Lütfen bir emoji girin ('q' girerek çıkabilirsiniz): ")
    if emoji_input.lower() == 'q':
        break
    emojis = ([c for c in emoji_input if c.isprintable() and c != "'" and c != "[" and c != "]" and c != " " and c != ","])
# şimdilik tek satır için baktığım için forun dışına aldım
print (emojis)
print (words)
data = {'Emoji': emojis, 'Words': [", ".join(words) for i in range(len(emojis))]}
df = pd.DataFrame(data)

# CSV dosyasına ekle
df.to_csv('output.csv', mode='a', header=False, index=False)


['🚀', '🌟', '🎂', '🦁']
['two', 'imprison', 'men', 'bond', 'number', 'years', 'find', 'solace', 'eventual', 'redemption', 'act', 'common', 'decency']


In [97]:
emojis_input = input("Lütfen bir emoji girin ('q' girerek çıkabilirsiniz): ")
emojis = [c for c in emojis_input if c.isprintable() and c != "'" and c != "[" and c != "]" and c != " " and c != ","]
print(emojis)

['🚀', '🌟', '🎂', '🦁']


In [73]:
words_df = pd.read_csv("input.csv", header=None)
words = [row[0].split(',') for index, row in words_df.iterrows()]
print(words)

[["'two'"]]


In [83]:
import csv

with open('input.csv', newline='') as csvfile:
    data = list(csv.reader(csvfile))[0]
    words = [w.strip("' ") for w in data]
    print(words)


['two', 'imprison', 'men', 'bond', 'number', 'years', 'find', 'solace', 'eventual', 'redemption', 'act', 'common', 'decency']


In [94]:
sa = ['sa', 'merhaba', 'selamlar']
print(sa)


['sa', 'merhaba', 'selamlar']


In [100]:
data_str = "two, imprison, men, bond, number, years, find, solace, eventual, redemption, act, common, decency"
data_arr = data_str.split(", ")
print(data_arr)

['two', 'imprison', 'men', 'bond', 'number', 'years', 'find', 'solace', 'eventual', 'redemption', 'act', 'common', 'decency']
