<style>
@keyframes gradientMove {
  0% { background-position: 0% 50%; }
  50% { background-position: 100% 50%; }
  100% { background-position: 0% 50%; }
}
.gradient-bg {
  border-radius: 10px;
  background: linear-gradient(-45deg, #ee7752, #e73c7e, #23a6d5, #23d5ab);
  background-size: 300% 300%;
  animation: gradientMove 8s ease infinite;
  font-size: 130%;
  text-align: left;
}
</style>

<div class="gradient-bg">
  <br/>
  <center><h1><font color='white'>Emrecan Üncü - CRM SALES PROJECT</font></h1></center>
  <br/>
</div>


In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os


## 🔄 Veri Dönüşümü (Data Transformation)

## 🔗 Veri Tabanı İlişkilendirme ve Optimizasyon Açıklaması

`sales_pipeline.csv` dosyasındaki **sales_agent**, **product** ve **account** sütunları başlangıçta tam adları içeriyordu ve bu adlar sırasıyla  
`sales_teams.csv`, `products.csv` ve `accounts.csv` dosyalarındaki kayıtlara karşılık geliyordu.

Veri tabanı işlemlerinin verimliliğini artırmak amacıyla,  
**sales_teams.csv**, **products.csv** ve **accounts.csv** dosyalarına benzersiz **tamsayı (ID)** sütunları eklendi.  
Ardından, `sales_pipeline.csv` dosyasındaki tam adlar bu **ID değerleriyle** değiştirildi.

### 💡 Bu değişiklik sayesinde:
- 🔄 **Veri tabanı sorgularında** (özellikle `JOIN` işlemlerinde) performans önemli ölçüde artırıldı,  
- ✅ **Veri tutarlılığı ve bütünlüğü** sağlandı,  
- 🧩 **İlişkisel veri tabanı yapısına uygun** bir model oluşturuldu.

---

### 🔐 Yabancı Anahtar (Foreign Key) İlişkileri

Bu düzenleme ile birlikte, `sales_pipeline.csv` dosyası artık diğer tablolarla **yabancı anahtar ilişkileri** üzerinden bağlanabilir hale gelmiştir:

| `sales_pipeline.csv` Alanı | Referans Tablo | Referans Sütunu |
|-----------------------------|----------------|-----------------|
| `sales_agent_id`           | `sales_teams.csv` | `id` |
| `product_id`               | `products.csv`    | `id` |
| `account_id`               | `accounts.csv`    | `id` |

---

Bu yapı sayesinde, veri tabanı **performansı**, **tutarlılığı** ve **bakımı** önemli ölçüde iyileştirilmiştir.


### 1. 🆔 ID Sütunlarının Eklenmesi
`products.csv`, `accounts.csv` ve `sales_teams.csv` dosyalarına benzersiz **kimlik (ID)** sütunları eklendi.  
Bu ID’ler, `sales_pipeline.csv` dosyasında referans olarak kullanılmakta olup, verinin standartlaştırılmasını ve sorgulama işlemlerinin daha verimli hale gelmesini sağlamaktadır.

In [None]:
ORIGINAL_FOLDER = r"C:\Users\NITRO\Desktop\CRM_Data_Analysis_for_Sales\Data\orginal data"
MODIFIED_FOLDER = r"C:\Users\NITRO\Desktop\CRM_Data_Analysis_for_Sales\Data\modified data"

In [None]:
CSV_FILES = [
    'accounts.csv',
    'products.csv',
    'sales_teams.csv'
]

In [None]:
for file_name in CSV_FILES:
    try:
        # 🔹 Dosya Yolu Oluşturma
        input_path = os.path.join(ORIGINAL_FOLDER, file_name)
        output_path = os.path.join(MODIFIED_FOLDER, file_name)

        # 🔹 CSV Dosyasını Okuma
        df = pd.read_csv(input_path)

        # 🔹 Yeni ID Değerleri Üretme (1'den başlar, her satır için +1)
        id_values = np.arange(1, len(df) + 1)

        # 🔹 ID Sütununu DataFrame'in İlk Sütunu Olarak Ekleme
        df.insert(loc=0, column='id', value=id_values)

        # 🔹 Bilgilendirme Çıktısı
        print(f"\n✅ '{file_name}' dosyası işlendi.")
        print(f"➡️  Toplam kayıt sayısı: {len(df)}")
        print(f"➡️  Yeni sütun: 'id'\n")
        print(df.head(), "\n")  # İlk birkaç satırı örnek olarak göster

        # 🔹 Güncellenmiş Dosyayı Kaydetme
        df.to_csv(output_path, index=False)
        print(f"💾 Kaydedildi: {output_path}\n" + "-" * 70)

    except Exception as e:
        print(f"❌ Hata oluştu: {file_name} dosyası işlenemedi.")
        print(f"📄 Hata detayı: {e}\n" + "-" * 70)


✅ 'accounts.csv' dosyası işlendi.
➡️  Toplam kayıt sayısı: 85
➡️  Yeni sütun: 'id'

   id           account     sector  year_established  revenue  employees  \
0   1  Acme Corporation  technolgy              1996  1100.04       2822   
1   2        Betasoloin    medical              1999   251.41        495   
2   3          Betatech    medical              1986   647.18       1185   
3   4        Bioholding    medical              2012   587.34       1356   
4   5           Bioplex    medical              1991   326.82       1016   

  office_location subsidiary_of  
0   United States           NaN  
1   United States           NaN  
2           Kenya           NaN  
3      Philipines           NaN  
4   United States           NaN   

💾 Kaydedildi: C:\Users\NITRO\Desktop\CRM_Data_Analysis_for_Sales\Data\modified data\accounts.csv
----------------------------------------------------------------------

✅ 'products.csv' dosyası işlendi.
➡️  Toplam kayıt sayısı: 7
➡️  Yeni sütun: 'id'



In [11]:
import pandas as pd
from sqlalchemy import create_engine

# PostgreSQL bağlantısı (kullanıcı=postgres, şifre=admin, port=6543)
engine = create_engine("postgresql://postgres:admin@localhost:6543/Data Source")

# CSV dosyasını oku (Windows yolu için raw string kullan)
df = pd.read_csv(r"C:\Users\NITRO\Desktop\CRM_Data_Analysis_for_Sales\Data\modified data\accounts.csv")

# Veriyi PostgreSQL'e yükle
df.to_sql("accounts", engine, index=False, if_exists="replace")

print("✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!")


✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!


In [8]:
import pandas as pd
from sqlalchemy import create_engine

# PostgreSQL bağlantısı (kullanıcı=postgres, şifre=admin, port=6543)
engine = create_engine("postgresql://postgres:admin@localhost:6543/Data Source")

# CSV dosyasını oku (Windows yolu için raw string kullan)
df = pd.read_csv(r"C:\Users\NITRO\Desktop\CRM_Data_Analysis_for_Sales\Data\modified data\products.csv")

# Veriyi PostgreSQL'e yükle
df.to_sql("products", engine, index=False, if_exists="replace")

print("✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!")


✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!


In [9]:
import pandas as pd
from sqlalchemy import create_engine

# PostgreSQL bağlantısı (kullanıcı=postgres, şifre=admin, port=6543)
engine = create_engine("postgresql://postgres:admin@localhost:6543/Data Source")

# CSV dosyasını oku (Windows yolu için raw string kullan)
df = pd.read_csv(r"C:\Users\NITRO\Desktop\CRM_Data_Analysis_for_Sales\Data\modified data\sales_teams.csv")

# Veriyi PostgreSQL'e yükle
df.to_sql("sales_teams", engine, index=False, if_exists="replace")

print("✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!")


✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!


In [12]:
import pandas as pd
from sqlalchemy import create_engine

# PostgreSQL bağlantısı (kullanıcı=postgres, şifre=admin, port=6543)
engine = create_engine("postgresql://postgres:admin@localhost:6543/Data Source")

# CSV dosyasını oku (Windows yolu için raw string kullan)
df = pd.read_csv(r"C:\Users\NITRO\Desktop\CRM_Data_Analysis_for_Sales\Data\orginal data\sales_pipeline.csv")

# Veriyi PostgreSQL'e yükle
df.to_sql("sales_pipeline", engine, index=False, if_exists="replace")

print("✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!")


✅ CSV dosyası 'accounts' tablosu olarak başarıyla PostgreSQL'e yüklendi!
