In [None]:
import pandas as pd
import pyodbc
import time

In [None]:
pip install openpyxl

In [None]:
df = pd.read_excel('data.xlsx')


In [None]:
df.head()

In [None]:
# TODO 
# data.xlsx içerisindeki örnek verileri sql database içerisine aktarıp analiz edelim.
# 5 farklı veri kaynağı bulup TechcareerDB içerisine aktaralım.

In [None]:
# Bağlantı bilgileri
server = 'localhost'
database = 'TechcareerDB'
username = 'sa'
password = 'YourStrong!Passw0rd'
driver = '{SQL Server}'  # Sürücü adını güncelledik
schema = 'dbo'  # Şema bilgisi

# Yüklü ODBC sürücülerini kontrol edelim
print("Yüklü ODBC sürücüleri:")
print(pyodbc.drivers())


In [None]:

# Bağlantı dizesi
conn_str = (
    f'DRIVER={driver};'
    f'SERVER={server};'
    f'DATABASE={database};'
    f'UID={username};'
    f'PWD={password}'
)

# Bağlantıyı test etme
try:
    conn = pyodbc.connect(conn_str)
    cursor = conn.cursor()
    cursor.execute("SELECT @@VERSION;")
    version = cursor.fetchone()
    print(f"SQL Server bağlantısı başarılı. Sürüm: {version[0]}")
    cursor.close()
    conn.close()
except pyodbc.Error as e:
    print("SQL Server'a bağlanılamadı.")
    print("Hata mesajı:", e)
    exit(1)

In [None]:

# Bağlantıyı tekrar aç
conn = pyodbc.connect(conn_str)
cursor = conn.cursor()

In [None]:

# Veritabanını oluştur (eğer yoksa)
cursor.execute(f"IF DB_ID(N'{database}') IS NULL CREATE DATABASE [{database}]")
cursor.commit()


In [None]:

# Tablo adı ve tam tablo adı
table_name = 'Jobs'
full_table_name = f'[{schema}].[{table_name}]'

# Sütun adları ve veri tiplerini belirleme
columns_with_types = ', '.join([f'[{col}] NVARCHAR(MAX)' for col in df.columns])

# Tabloyu oluştur (eğer yoksa)
create_table_query = f'''
IF OBJECT_ID(N'{schema}.{table_name}', N'U') IS NULL
BEGIN
    CREATE TABLE {full_table_name} (
        {columns_with_types}
    )
END
'''
cursor.execute(create_table_query)
cursor.commit()


In [None]:
df.head()

In [60]:


# DataFrame'deki NaN değerlerini None ile değiştiriyoruz
df = df.where(pd.notnull(df), None)

# Tarih sütunlarını belirleme
date_columns = df.select_dtypes(include=['datetime', 'datetime64[ns]']).columns.tolist()
print("Tarih sütunları:", date_columns)


# DataFrame'i SQL Server'a yazma (1000'lik parçalar halinde)
columns = ', '.join([f'[{col}]' for col in df.columns])
placeholders = ', '.join(['?' for _ in df.columns])
insert_query = f'INSERT INTO {full_table_name} ({columns}) VALUES ({placeholders})'

data = [tuple(row) for row in df.values]

chunk_size = 100  # Her seferinde 100 satır ekle
total_rows = len(df)
for start in range(0, 500, chunk_size): #total_rows
    end = min(start + chunk_size, total_rows)
    chunk_df = df.iloc[start:end]
    chunk_data = [tuple(row) for row in chunk_df.values]
    try:
        cursor.executemany(insert_query, chunk_data)
        conn.commit()
        print(f"{start + 1}-{end} arası satırlar eklendi.")
    except pyodbc.Error as e:
        print(f"{start + 1}-{end} arası satırlar eklenirken hata oluştu.")
        print("Hata mesajı:", e)
        conn.rollback()
        # Problemli satırları yazdırma
        print(chunk_df)
        exit(1)


Tarih sütunları: ['LastApplyDate', 'PublishDate', 'CreateDate']
1-100 arası satırlar eklenirken hata oluştu.
Hata mesajı: ('22008', '[22008] [Microsoft][ODBC SQL Server Driver]Datetime field overflow (0) (SQLExecDirectW)')
    SiteId   JobNo                        JobTitle  \
0       60  211919                   TEKNIK SERVIS   
1       60  225513     MUHASEBE / FINANS GÖREVLISI   
2       60  289519             ELEKTRIK TEKNISYENI   
3       60  292417                 VINÇ OPERATÖRÜ    
4       60  292421                           SOFÖR   
..     ...     ...                             ...   
95      25   63270           Çağrı Merkezi Elemanı   
96      25   63272        Satış Danışmanı Arıyoruz   
97      25   63274          Proje Elemanı Arıyoruz   
98      25   63276  Gayrimenkul Danışmanı Arıyoruz   
99      25   63279                   Komi Arıyoruz   

                          Position LastApplyDate        JobLocation  \
0                    TEKNIK SERVIS    2024-12-14         

In [None]:
conn_str = (
    f"DRIVER={driver};"
    f"SERVER=localhost;"
    f"DATABASE={database};"
    f"UID={username};"
    f"PWD={password}"
)


In [None]:
import time
import pyodbc

# Maksimum deneme sayısı ve bekleme süresi
max_retries = 10
wait_seconds = 5

for attempt in range(max_retries):
    try:
        conn = pyodbc.connect(conn_str)
        print("SQL Server'a başarılı bir şekilde bağlanıldı.")
        break
    except pyodbc.Error as e:
        print(f"Bağlantı denemesi {attempt + 1}/{max_retries} başarısız oldu. Bekleniyor...")
        time.sleep(wait_seconds)
else:
    print("SQL Server'a bağlanılamadı. Lütfen ayarları kontrol edin.")
    exit(1)
