## Veri Setinin Yüklenmesi ve İncelenmesi

In [1]:
import pandas as pd

# Veri setini yükle
df = pd.read_csv('code_data.csv')

# Veri setini incele
print(df.head())

                               description                     code
0         Pandas kütüphanesini içe aktarma      import pandas as pd
1                 Veri çerçevesi oluşturma  df = pd.DataFrame(data)
2  Veri çerçevesini csv dosyasına kaydetme  df.to_csv('output.csv')


## Doğal Dil İşleme (NLP) Hazırlıkları

In [2]:
import nltk
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize

# Örnek bir açıklamayı tokenize etme
example_text = df['description'][0]
tokens = word_tokenize(example_text)
filtered_tokens = [word for word in tokens if word.lower() not in stopwords.words('english')]

print(filtered_tokens)

['Pandas', 'kütüphanesini', 'içe', 'aktarma']


## Makine Öğrenmesi Modeli Eğitimi

In [3]:
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import make_pipeline

# Özellik ve hedef değişkenleri ayırma
X = df['description']
y = df['code']

# Eğitim ve test setlerine ayırma
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# TF-IDF vektörizer ile Multinomial Naive Bayes modelini pipeline içinde kullanma
model = make_pipeline(TfidfVectorizer(), MultinomialNB())

# Modeli eğitme
model.fit(X_train, y_train)

# Modelin performansını değerlendirme
print("Model Skoru:", model.score(X_test, y_test))

Model Skoru: 0.0


# Yeni Kod Üretimi

In [4]:
# Yeni bir açıklama
new_description = "Veri çerçevesini csv dosyasına kaydetme"

# Tahmin edilen kod
predicted_code = model.predict([new_description])
print("Tahmin Edilen Kod:", predicted_code[0])

Tahmin Edilen Kod: df.to_csv('output.csv')
