In [4]:
import pandas as pd
import os

# Giriş dosyası
input_file = (
    r"C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\LSTMProduct2.csv"
)

# Türkçe → İngilizce kolon çevirisi
column_mapping = {
    "Ekran Boyutu": "Display Size",
    "Ekran Teknolojisi": "Display Technology",
    "Piksel Yoğunluğu": "Pixel Density",
    "Batarya Kapasitesi": "Battery Capacity",
    "Kamera Çözünürlüğü": "Camera Resolution",
    "CPU Üretim Teknolojisi": "CPU Manufacturing",
    "İşletim Sistemi": "Operating System",
    "RAM Kapasitesi": "RAM",
    "Dahili Hafıza": "Internal Storage",
    "Ekran Yenileme Hızı": "Refresh Rate",
    "Model": "Model",
    "5G": "5G",
    "Price": "Price",
}

# CSV'yi oku
if not os.path.exists(input_file):
    raise FileNotFoundError(f"Giriş dosyası bulunamadı: {input_file}")

df = pd.read_csv(input_file)

if "Description" not in df.columns:
    raise KeyError("CSV dosyasında 'Description' sütunu bulunamadı.")

# Description kolonunu parse et ve yeni sütunları oluştur
parsed_data = []
for _, row in df.iterrows():
    description = str(row.get("Description", ""))
    specs = {}

    for part in description.split(";"):
        if ":" in part:
            key, value = part.split(":", 1)
            key = key.strip()
            value = value.strip()
            english_key = column_mapping.get(key, key)
            specs[english_key] = value

    parsed_data.append(specs)

# Yeni kolonlar olarak ekle
parsed_df = pd.DataFrame(parsed_data)

# Orijinal DataFrame'e join et (index üzerinden hizalanır)
df_updated = pd.concat([df, parsed_df], axis=1)

# Kaydet
df_updated.to_csv("hello.csv", index=False, encoding="utf-8-sig")
print(
    "✔ Dosya mevcut kolonlar korunarak ve Description bilgileri ayrılarak kaydedildi."
)

✔ Dosya mevcut kolonlar korunarak ve Description bilgileri ayrılarak kaydedildi.


In [8]:
import pandas as pd
import re

# Dosya yolları
input_file = (
    r"C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\hello.csv"
)
output_file = "productDetail_updated.csv"

# Dosyayı oku
df = pd.read_csv(input_file)

# Eksik verileri 0 ile doldur
df.fillna(0, inplace=True)


# IPX / IP değerlerinden rakamı çek
def extract_ipx_number(value):
    if isinstance(value, str):
        match = re.search(r"\d+", value)  # ilk gördüğü sayıyı alır
        if match:
            return int(match.group())
    return 0


# Uygula: Suya ve Toza Dayanıklılık kolonlarına
if "Suya dayanıklılık" in df.columns:
    df["Waterproof"] = df["Suya dayanıklılık"].apply(extract_ipx_number)
if "Toza dayanıklılık" in df.columns:
    df["Dustproof"] = df["Toza dayanıklılık"].apply(extract_ipx_number)

# Orijinal kolonları isteğe bağlı olarak silebilirsin
# df.drop(columns=["Suya dayanıklılık", "Toza dayanıklılık"], inplace=True)

# Kaydet
df.to_csv(output_file, index=False, encoding="utf-8-sig")
print(f"{output_file} dosyası başarıyla güncellendi.")

productDetail_updated.csv dosyası başarıyla güncellendi.


In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# CSV dosyasını oku
df = pd.read_csv(
    r"C:\Users\pc\Desktop\AIbazaar\AIBazaar\AI\utils\notebooks\product_specs_en.csv"
)

# Sadece sayısal sütunları seç
numeric_df = df.select_dtypes(include=['int64', 'float64'])

# Korelasyon matrisini hesapla
corr = numeric_df.corr()

# Korelasyon ısı haritası çizimi
plt.figure(figsize=(12, 8))
sns.heatmap(corr, annot=True, cmap='coolwarm', fmt=".2f", linewidths=0.5)
plt.title("Telefon Özellikleri Sayısal Değişkenler Korelasyon Matrisi")
plt.show()

In [None]:
import pandas as pd

df = pd.read_csv(r"C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\XGBoostData.csv") 

df["ProductName"] = df["Description"].str.extract(r'Model:\s*([^;]+)')

df["Description"] = df["Description"].str.replace(r'Model:\s*[^;]+;\s*', '', regex=True)

df.to_csv("newProductData.csv", index=False,encoding="utf-8-sig")

print(df.head())


In [None]:
import pandas as pd

df = pd.read_csv(r"C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\Product.csv")

mean_prices = df.groupby("Display Technology")["Price"].mean().sort_values(ascending=False)

price_ratios = mean_prices / mean_prices.min()

result_df = pd.DataFrame({
    "Average Price": mean_prices,
    "Ratio to Highest": price_ratios
})

print(result_df)


In [None]:
import pandas as pd
df = pd.read_csv(r"C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\Product.csv")
prediction_price = 15000
df["price_diff"] = (df["Price"] - prediction_price).abs()
df = df[df["price_diff"] <= prediction_price * 0.1]  
print(df.head(5))

print(len(df))

In [None]:
import pandas as pd

df1 = pd.read_csv(r'C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\product_specs_en.csv')  
df2 = pd.read_csv(r'C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\LSTMPriceHistory.csv')  

df1['Model'] = df1['Model'].str.strip()
df2['Model'] = df2['Model'].str.strip()

model_to_id = df1.set_index('Model')['ProductID'].to_dict()

df2['ProductID'] = df2.apply(
    lambda row: model_to_id.get(row['Model'], row['ProductID']),
    axis=1
)

df2.to_csv(r'C:\Users\EXCALIBUR\Desktop\kass.csv', index=False)

print("✅ CSV2'deki ProductID'ler, Model eşleşmesine göre CSV1'den güncellendi.")


In [None]:
import pandas as pd

df1 = pd.read_csv(r'C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\Product.csv')  df2 = pd.read_csv(r'C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\product_specs_en.csv')  

df1['Model'] = df1['Model'].str.strip()
df2['Model'] = df2['Model'].str.strip()

id_to_model = df1.set_index('ProductID')['Model'].to_dict()

df2['Model'] = df2.apply(
    lambda row: id_to_model.get(row['ProductID'], row['Model']),
    axis=1
)

df2.to_csv(r'C:\Users\EXCALIBUR\Desktop\nesa.csv', index=False)

print("✅ CSV2'deki Model isimleri, ProductID'ye göre CSV1'den güncellendi.")


In [2]:
import pandas as pd

# 1. Tüm telefonları içeren dosyayı oku
all_df = pd.read_csv(
    r"C:\Users\pc\Desktop\AIbazaar\AIBazaar\AI\utils\notebooks\product_specs_en.csv"
)

# 2. Sadece iOS olanları filtrele
ios_df = all_df[all_df["Operating System"] == "iOS"]

# 3. Hedef dosya varsa oku, yoksa boş bir DataFrame oluştur
try:
    target_df = pd.read_csv(r"C:\Users\pc\Desktop\AIbazaar\AIBazaar\AI\utils\notebooks\Product.csv")
except FileNotFoundError:
    target_df = pd.DataFrame(columns=all_df.columns)

# 4. Yeni iOS verilerini hedef dosyaya ekle (varsa tekrar edenleri engellemek için concat + drop_duplicates)
merged_df = pd.concat([target_df, ios_df], ignore_index=True).drop_duplicates()
merged_df.drop_duplicates()
# 5. Güncellenmiş ios_only.csv dosyasını kaydet
merged_df.to_csv("Product.csv", index=False, encoding="utf-8-sig")

print("✔ iOS telefonlar başarıyla ios_only.csv dosyasına eklendi.")

FileNotFoundError: [Errno 2] No such file or directory: 'C:\\Users\\pc\\Desktop\\AIbazaar\\AIBazaar\\AI\\utils\\notebooks\\product_specs_en.csv'

In [13]:
import pandas as pd
df = pd.read_csv(r"C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\updated_phones.csv")
df.drop_duplicates(subset=["ProductID"], keep="first", inplace=True)
df.to_csv("updated.csv", index=False, encoding="utf-8-sig")

In [1]:
import pandas as pd

# CSV dosyasını oku
df = pd.read_csv(r"C:\Users\EXCALIBUR\Desktop\projects\Okul Ödevler\AIBazaar\AI\utils\notebooks\Product.csv")

# Operating System sütunu iOS olanları filtrele (drop et)
df = df[df["Operating System"] != "iOS"]

# Yeni CSV olarak kaydet
df.to_csv("product_without_ios.csv", index=False, encoding="utf-8-sig")
