# **Sentetik Veri Oluşturma**

Proje için yeterli veya uygun kaynak bulunamadığı için sentetik veri üretme algoritması geliştirilerek sentetik veri oluşturuldu.

In [97]:
import pandas as pd
import random

**9 farklı departman belirlendi ve bu departmanlar için anahtar sözcükler belirlenerek, her departmana özgü belge başlıkları ve içerik şablonları oluşturuldu.**

*Bu depatmanlar sırası ile ;*

*   İnsan Kaynakları (İK)
*   Mali İşler
*   Satın Alma
*   Hukuk
*   Teknik Destek
*   Pazarlama
*   Genel Müdürlük
*   Eğitim ve Gelişim
*   Kalite Yönetimi













Bu kod, her bir departman için belge başlıkları ve içerik şablonlarını tanımlar. Şablonlar, dinamik değişkenlerle ({name}, {date}, {reason} vb.) oluşturulmuş olup, rastgele değerlerle doldurularak sentetik veri üretiminde kullanılır. Amaç, gerçekçi belgeler oluşturmak için yapı sağlamaktır.

In [188]:
# Departmanlar için içerikler hazırlandı

titles_contents = {
    "İnsan Kaynakları": [
        ("Çalışan İzin Talebi",
         "Çalışan {name}, {reason} nedeniyle yıllık izin talebinde bulunmuştur. "
         "İzin süresi {start_date} - {end_date} tarihleri arasını kapsamaktadır. Talep edilen izin, "
         "{supervisor} tarafından onay beklemektedir."),
        ("Performans Değerlendirme",
         "{name}, yıl sonu performans değerlendirmesinde {rating} not almıştır. "
         "Değerlendirme kriterleri arasında hedef gerçekleştirme, takım çalışması ve "
         "problem çözme becerileri yer almaktadır. Detaylı rapor ekte sunulmuştur."),
        ("Eğitim Katılım Raporu",
         "{name}, {training_type} eğitimine katılım sağlamıştır. Eğitimin içeriği ve "
         "sonuç raporu ekte yer almaktadır. Eğitim sonrası başarı oranı %80 olarak ölçülmüştür."),
        ("Çalışan Şikayeti",
         "Çalışan {name}, {complaint_type} ile ilgili şikayetini İnsan Kaynakları'na iletmiştir. "
         "Sorunun çözülmesi için gerekli birimler bilgilendirilmiş ve bir aksiyon planı oluşturulmuştur."),
        ("Terfi Bildirimi",
         "Çalışan {name}, başarılı performansı sonucunda {new_position} pozisyonuna terfi etmiştir. "
         "Terfi tarihi {date} olarak belirlenmiştir. Tebrik ederiz."),
        ("İşten Ayrılma Bildirimi",
         "Çalışan {name}, {reason} nedeniyle işten ayrılma talebini iletmiştir. "
         "Ayrılış tarihi {date} olarak belirlenmiştir. Devir teslim planı hazırlanmıştır."),
        ("Yeni Çalışan Oryantasyonu",
         "Yeni işe başlayan {name}, {date} tarihinde oryantasyon programına katılım sağlamıştır. "
         "Program detayları ve içerikleri ekte yer almaktadır."),
        ("Disiplin Kararı Bildirimi",
         "Çalışan {name}, {incident} olayı nedeniyle disiplin kuruluna sevk edilmiştir. "
         "Kurul sonucu {decision} olarak açıklanmıştır.")
    ],
    "Mali İşler": [
        ("Bütçe Onayı",
         "2024 yılı için hazırlanan bütçe planında {department} departmanına ayrılan bütçe, geçen yıla göre %10 artış göstermiştir. "
         "Bütçe detayları ve onay süreci için ilgili belgeler ekte yer almaktadır."),
        ("Fatura Uyuşmazlığı",
         "{supplier} firmasına ait {amount} TL tutarındaki faturada hatalı ödeme kalemleri tespit edilmiştir. "
         "Firmadan güncellenmiş fatura talep edilmiştir."),
        ("Vergi Ödeme Bildirimi",
         "Şirketimize ait vergi yükümlülükleri için {deadline} tarihine kadar ödeme yapılması gerekmektedir. "
         "Evrakların ilgili departmanlara gönderilmesi talep edilmiştir."),
        ("Gelir-Gider Raporu",
         "Geçtiğimiz çeyrekte toplam gelir {income} TL, toplam gider {expense} TL olarak hesaplanmıştır. "
         "Net kar marjı %12 olarak belirlenmiştir. Ayrıntılı rapor ekte sunulmuştur."),
        ("Bütçe Revizyonu Bildirimi",
         "2024 yılı {department} departmanı bütçesinde %5 oranında revizyon yapılmıştır. Revize edilen bütçe detayları ekte yer almaktadır."),
        ("Ödeme Planı Bildirimi",
         "{supplier} firması ile yapılan anlaşmaya göre {amount} TL tutarındaki ödeme, {installments} taksitte gerçekleştirilecektir. İlk ödeme tarihi {date} olarak belirlenmiştir."),
        ("Mali Risk Raporu",
         "{period} dönemi için yapılan finansal analiz sonucunda, mali risk faktörleri değerlendirilmiştir. Rapor ve alınması önerilen önlemler ekte sunulmuştur."),
        ("Banka İşlem Bildirimi",
         "{bank_name} bankasında yapılan {transaction_type} işlemi sonucunda {amount} TL aktarılmıştır. İşlem detayları ve dekont ekte yer almaktadır.")
    ],
    "Satın Alma": [
        ("Malzeme Sipariş Talebi",
         "{department} departmanında kullanılan {item_list} ürünleri stokta kalmamıştır. "
         "Acil sipariş gereksinimi doğmuştur. Teklif veren firmalar arasında en uygun fiyat {supplier} tarafından sunulmuştur."),
        ("Tedarikçi Değerlendirme",
         "{supplier} firmasıyla yapılan işbirliği sonucu teslimat sürelerinde aksaklık yaşandığı tespit edilmiştir. "
         "Tedarikçiden iyileştirme planı talep edilmiştir."),
        ("Ürün İade İşlemi",
         "{item_list} ürünlerinde tespit edilen kusurlar nedeniyle toplam {amount} TL tutarındaki ürünler tedarikçiye iade edilmiştir."),
        ("Yeni Satın Alma Politikası",
         "2024 yılı itibariyle şirketin satın alma süreçlerinde çevre dostu ve sürdürülebilir ürünlere öncelik verilecektir. "
         "Bu doğrultuda yeni tedarikçi listesi oluşturulmuştur."),
        ("Teklif Toplama Raporu",
         "{item_list} ürünleri için {supplier_count} tedarikçiden fiyat teklifi alınmıştır. En uygun teklif {best_supplier} tarafından sunulmuştur."),
        ("Satın Alma Sözleşmesi",
         "{supplier} firması ile {contract_date} tarihinde {contract_type} sözleşmesi imzalanmıştır. Sözleşme detayları ekte yer almaktadır."),
        ("Tedarik Süreci Gecikme Bildirimi",
         "{supplier} firmasından alınan {item_list} ürünlerinin teslimatında {delay_reason} nedeniyle gecikme yaşanmıştır. Yeni teslim tarihi {new_date} olarak belirlenmiştir."),
        ("Stok Takip Raporu",
         "{department} departmanında bulunan {item_list} ürünlerinin stok seviyesi %10'un altına düşmüştür. Acil sipariş gereksinimi doğmuştur.")

    ],
    "Hukuk": [
        ("Dava Bilgilendirme",
         "Şirketimiz aleyhine açılan {case_type} davası ile ilgili ilk duruşma tarihi {date} olarak belirlenmiştir. "
         "Dava detayları ve savunma stratejisi hukuk birimi tarafından hazırlanmaktadır."),
        ("Sözleşme Onayı",
         "{contract_type} sözleşmesi, {lawyer_name} tarafından incelenmiş ve onaylanmıştır. "
         "Ek sözleşme maddeleri için karşı tarafın onayı beklenmektedir."),
        ("Uyumluluk Denetimi",
         "Hukuk birimi tarafından şirket içi uyumluluk politikalarının yasal standartlara uygunluğu denetlenmiştir. "
         "Tespit edilen eksiklikler için bir rapor hazırlanmıştır."),
        ("Yasal Uyarı",
         "Şirketimize gelen {complaint_type} şikayeti doğrultusunda yasal uyarı yapılmıştır. "
         "Detaylar hukuk departmanında değerlendirilmektedir."),
        ("Hukuki Görüş Raporu",
         "{case_subject} konusuyla ilgili hukuki görüş hazırlanmıştır. Detaylı rapor ekte yer almaktadır."),
        ("Sözleşme Değişiklik Bildirimi",
         "{contract_type} sözleşmesine {change_date} tarihinde ek maddeler eklenmiştir. Güncellenmiş sözleşme ekte yer almaktadır."),
        ("Dava Sonuç Bildirimi",
         "{case_type} davasının sonucu {verdict} olarak açıklanmıştır. Dava sürecine ilişkin detaylar raporda yer almaktadır."),
        ("İhlal Bildirimi",
         "{department} departmanında tespit edilen {violation_type} ihlaliyle ilgili yasal işlemler başlatılmıştır. Süreç takip edilmektedir.")

    ],
    "Teknik Destek": [
        ("Sistem Çökmesi",
         "{department} departmanında kullanılan {software_name} yazılımında ani bir çökme yaşanmıştır. "
         "Bu durum nedeniyle iş akışı kesintiye uğramış ve çözüm için teknik destek ekibi bilgilendirilmiştir."),
        ("Donanım Sorunu",
         "{department} çalışanlarının kullandığı {device_type} cihazlarında {issue} hatası tespit edilmiştir. "
         "Cihazların onarımı için teknik ekip yönlendirilmiştir."),
        ("Ağ Performansı",
         "Şirket genelinde yaşanan ağ yavaşlaması, {cause} nedeniyle kaynaklanmaktadır. "
         "Teknik ekip çözüm için çalışmalarını sürdürmektedir."),
        ("Yazılım Güncellemesi",
         "{software_name} yazılımı için kritik bir güncelleme yayınlanmıştır. Güncelleme işlemi, {date} tarihinde tamamlanacaktır."),
        ("Destek Talep Raporu",
         "{department} departmanından gelen {issue_type} ile ilgili destek talebi alınmıştır. Çözüm süreci başlatılmıştır."),
        ("Bakım Planlaması",
         "{device_type} cihazları için {date} tarihinde bakım planlanmıştır. Bakım işlemleri sırasında oluşabilecek kesintilere karşı önlemler alınacaktır."),
        ("Sorun Çözüm Raporu",
         "{issue_type} sorunu, {resolution_time} saat içinde çözülmüştür. Çözüm detayları raporda yer almaktadır."),
        ("Ağ Güvenlik Bildirimi",
         "{threat_type} tehdidi tespit edilmiştir. Güvenlik önlemleri artırılmış ve tüm sistemler güncellenmiştir."),
        ("Sistem Performans Raporu",
         "{system_name} sistemi üzerinde yapılan performans testleri tamamlanmıştır. Test sonuçları ve öneriler raporda yer almaktadır."),
        ("Acil Durum Müdahale Raporu",
         "{incident_type} olayında acil müdahale ekibi tarafından yapılan işlemler ve çözüm süreci raporlanmıştır."),
        ("Yedekleme ve Kurtarma Testi",
         "{backup_system} sisteminde yedekleme ve veri kurtarma testleri başarıyla tamamlanmıştır. Test sonuçları ve öneriler ekte yer almaktadır."),
        ("Donanım Envanter Raporu",
         "{department} departmanında kullanılan donanımların envanter raporu hazırlanmıştır. Eksik ve arızalı donanımlar belirlenmiştir."),
        ("Şifre Sıfırlama Talebi",
         "{user_name} tarafından şifre sıfırlama talebi iletilmiştir. Yeni şifre oluşturulmuş ve kullanıcının e-posta adresine gönderilmiştir."),
        ("Erişim Yetkilendirme Raporu",
         "{user_name} için {system_name} sistemine erişim yetkisi verilmiştir. Yetkilendirme detayları ve roller raporda belirtilmiştir."),
        ("VPN Bağlantı Sorunu",
         "{user_name} tarafından VPN bağlantısı ile ilgili {issue_type} sorunu bildirilmiştir. Sorunun kaynağı belirlenmiş ve çözüm uygulanmıştır."),
        ("E-posta Gönderim Problemi",
         "{user_name} tarafından iletilen e-posta gönderim hatasıyla ilgili teknik inceleme yapılmıştır. Sunucu ayarları güncellenmiş ve sorun giderilmiştir."),
        ("Antivirüs Taraması Raporu",
         "{device_name} cihazında yapılan antivirüs taraması sonucunda {threat_count} adet tehdit tespit edilmiştir. Temizlik işlemi tamamlanmıştır."),
        ("Ağ Bağlantı Sorunu Çözüm Raporu",
         "{department} departmanında yaşanan ağ bağlantı problemi çözülmüştür. Sorunun {cause} kaynaklı olduğu tespit edilmiştir.")


    ],
    "Pazarlama": [
        ("Kampanya Planı",
         "Yeni reklam kampanyası için {platform} üzerinde çalışmalara başlanmıştır. Kampanyanın hedef kitlesi {audience} olarak belirlenmiştir."),
        ("Müşteri Anketi",
         "Müşteri memnuniyet anketine toplam {number} kişi katılmıştır. Anket sonuçlarına göre müşteri şikayet oranı %10 azalmıştır."),
        ("Marka İşbirliği Teklifi",
         "{brand} markası ile işbirliği teklifine olumlu dönüş alınmıştır. İşbirliği süreci hakkında detaylar ekte yer almaktadır."),
        ("Sosyal Medya Performans Raporu",
         "Sosyal medya platformlarında {metric} artış gözlemlenmiştir. Kampanya performansı detaylı olarak analiz edilmiştir."),
        ("Pazar Araştırma Raporu",
         "{market_type} alanında yapılan pazar araştırması sonuçları ekte sunulmuştur. Rapor, müşteri tercihleri ve rekabet analizi içermektedir."),
        ("Reklam Performans Değerlendirmesi",
         "{platform} platformunda yürütülen reklam kampanyası {metric} artış sağlamıştır. Kampanya etkisi detaylı olarak analiz edilmiştir."),
        ("Rakip Analiz Raporu",
         "{competitor_name} firmasının son dönemdeki pazarlama faaliyetleri ve stratejileri incelenmiştir. Elde edilen veriler stratejik öneriler ile birlikte raporlanmıştır."),
        ("Etkinlik ve Sponsorluk Bildirimi",
         "{event_name} etkinliğinde {brand} markası sponsor olarak yer alacaktır. Etkinlik detayları ve katılım planı raporlanmıştır.")

    ],
    "Genel Müdürlük": [
        ("Genel Duyuru",
         "Tüm birimlere genel bir bilgilendirme yapılmıştır."),
        ("Stratejik Planlama",
         "Şirketin 5 yıllık stratejik planı tamamlanmıştır."),
        ("Yönetim Toplantısı Sonuçları",
         "Son yapılan yönetim toplantısının sonuçları paylaşılmıştır."),
        ("Kurumsal Yenilik Bildirimi",
         "Şirketin yenilikçi yaklaşımlarını duyuran bir açıklama yapılmıştır."),
        ("Kurumsal Performans Raporu",
         "Şirketin {quarter} dönemi performans raporu hazırlanmıştır. Finansal ve operasyonel sonuçlar detaylı olarak raporlanmıştır."),
        ("Yatırım Planı Bildirimi",
         "{investment_project} projesine yönelik yatırım planı hazırlanmıştır. Proje detayları ve bütçe bilgileri ekte yer almaktadır."),
        ("Risk Yönetimi Raporu",
         "Şirketin {risk_area} alanında potansiyel risk faktörleri değerlendirilmiştir. Alınması gereken önlemler ve aksiyon planları raporlanmıştır."),
        ("Kurumsal Sosyal Sorumluluk Raporu",
         "{csr_project} kapsamında gerçekleştirilen sosyal sorumluluk projeleri detaylandırılmıştır. Katılım oranları ve etkileri raporda belirtilmiştir.")

    ],
    "Kalite Yönetimi": [
        ("Denetim Raporu",
         "Kalite standartları için yapılan denetimlerin raporu sunulmuştur."),
        ("İyileştirme Önerisi",
         "Proseslerde iyileştirme yapılması önerilmektedir."),
        ("Kalite Kontrol Planı",
         "Üretim süreçleri için yeni bir kalite kontrol planı hazırlanmıştır."),
        ("Müşteri Şikayet Analizi",
         "Müşteri şikayetleri detaylı olarak analiz edilmiştir."),
        ("Süreç İyileştirme Raporu",
         "{process_name} sürecinde yapılan incelemeler sonucunda iyileştirme önerileri belirlenmiştir. Detaylar ekte sunulmuştur."),
        ("Standart Uyumluluk Bildirimi",
         "{standard_name} standardına uyumluluk kontrolü yapılmıştır. Uyum sağlanan ve eksik kalan alanlar raporda belirtilmiştir."),
        ("Hata Analiz Raporu",
         "{error_type} hatası üzerine yapılan analiz sonuçları açıklanmıştır. Hatanın kaynağı ve çözüm önerileri raporlanmıştır."),
        ("Ürün Kalite Test Sonuçları",
         "{product_name} ürününe uygulanan kalite testleri başarıyla tamamlanmıştır. Test sonuçları detaylı şekilde raporlanmıştır.")

    ],
    "Eğitim ve Gelişim": [
        ("Eğitim Planlaması",
         "Yeni çalışanlar için oryantasyon eğitimleri planlanmıştır."),
        ("Seminer Duyurusu",
         "Tüm çalışanlara yönelik motivasyon semineri düzenlenmiştir."),
        ("Mesleki Gelişim Eğitimi",
         "Çalışanların mesleki gelişimine katkı sağlamak için eğitim düzenlenmiştir."),
        ("Eğitim Katılım Raporu",
         "Eğitim programlarına katılan çalışanların raporu hazırlanmıştır."),
        ("Eğitim Değerlendirme Raporu",
         "{training_name} eğitimi sonrası yapılan değerlendirme sonuçları ekte sunulmuştur. Katılım oranları ve başarı yüzdeleri analiz edilmiştir."),
        ("Mentorluk Programı Bildirimi",
         "Yeni mentorluk programı {start_date} tarihinde başlatılmıştır. Program kapsamında mentor ve mentee eşleştirmeleri tamamlanmıştır."),
        ("Uzaktan Eğitim Modülü Güncellemesi",
         "{module_name} modülü güncellenmiştir. Yeni içerikler ve materyaller eğitim portalında yayınlanmıştır."),
        ("Eğitim İhtiyaç Analizi",
         "{department} departmanında yapılan analiz sonucunda ihtiyaç duyulan eğitim başlıkları belirlenmiştir. Önerilen eğitim programları raporda yer almaktadır.")

    ]
}

Bu kod, sentetik veri oluşturmak için kullanılacak rastgele değerlerin listelerini tanımlar. Her liste, belirli bir kategorideki olası değerleri içerir (ör. çalışan isimleri, departmanlar, yazılım adları, tarih aralıkları). Bu değerler, dinamik içerikler oluşturmak için şablonlara yerleştirilir ve gerçekçi görünümlü veri setleri oluşturulmasını sağlar.

In [194]:
# Rastgele değişkenler

names = ["Ahmet Yılmaz", "Ayşe Demir", "Mehmet Kaya", "Fatma Özkan", "Ali Çelik",
         "Zeynep Korkmaz", "Burak Aksoy", "Deniz Öztürk", "Banu Sarı", "Hakan Özdemir"]

departments = ["İnsan Kaynakları", "Mali İşler", "Satın Alma", "Teknik Destek",
               "Pazarlama", "Genel Müdürlük", "Hukuk", "Eğitim ve Gelişim",
                "Kalite Yönetimi"]

supervisors = ["Elif Aydın", "Murat Korkmaz", "Burak Öztürk", "Hakan Demir", "Deniz Sarı",
               "Ahmet Yılmaz", "Sevgi Korkmaz", "Fatma Demir", "Yusuf Polat", "Banu Uysal"]

reasons = [
    "yıllık izin", "sağlık sorunu", "ailevi nedenler", "eğitim programı",  "kişisel sebepler", 
    "doğum izni", "evlilik hazırlıkları", "taşınma işlemleri"
]

suppliers = ["ABC Tedarik", "XYZ Firması", "Global Market", "Tech Solutions",
             "Green Supplies", "EcoTech", "Secure Systems"]

items = ["bilgisayar", "ofis sandalyesi", "kağıt ve toner", "yazıcı",
         "klavye ve mouse", "hard disk", "proje ekranı", "sunucu yedek parçası"]

amounts = ["5.000", "10.000", "20.000", "50.000", "75.000", "100.000", "200.000"]

income = ["500.000", "750.000", "1.000.000", "1.500.000", "2.000.000"]

expense = ["350.000", "400.000", "600.000", "750.000", "900.000"]

device_types = ["laptop", "masaüstü bilgisayar", "yazıcı", "ağ anahtarı", "tablet",
                "akıllı telefon", "proje ekranı"]

issues = ["donma", "yavaş çalışma", "sesli çalışıyor", "bağlantı hatası",
          "yüksek sıcaklık uyarısı", "sistem çökmesi"]

start_dates = ["1 Ocak", "15 Ocak", "1 Şubat", "15 Şubat", "1 Mart", "15 Mart", 
              "1 Nisan", "15 Nisan", "1 Mayıs", "15 Mayıs"]
              
end_dates = ["30 Ocak", "14 Şubat", "28 Şubat", "14 Mart", "30 Mart", "14 Nisan", 
            "30 Nisan", "14 Mayıs", "30 Mayıs", "14 Haziran"]

software_names = ["CRM Sistemi", "Muhasebe Yazılımı", "E-posta İstemcisi",
                  "ERP Sistemi", "Veritabanı Yönetim Yazılımı",
                  "Proje Yönetim Aracı", "Siber Güvenlik Yazılımı"]

training_types = ["liderlik eğitimi", "zaman yönetimi", "teknik beceri eğitimi",
                  "müşteri ilişkileri eğitimi", "veri analitiği eğitimi"]

complaint_types = ["personel sorunları", "şirket politikaları", "ödeme gecikmesi",
                   "ağ sorunları", "fazla mesai"]

case_types = ["ticari", "hak ihlali", "tazminat", "sözleşme feshi", "patent ihlali"]

contract_types = ["hizmet", "tedarik", "satış", "ortaklık"]

ratings = ["A", "B", "C", "D"]

deadlines = ["15 Ocak", "28 Şubat", "10 Mart", "25 Nisan", "30 Haziran", "15 Temmuz", "1 Eylül", "20 Kasım"]

lawyer_names = ["Sevgi Korkmaz", "Cenk Acar", "Ece Özkan", "Ahmet Ersoy", "Melis Yıldız", "Burak Aksoy"]

causes = ["aşırı yükleme", "sunucu arızası", "ağ trafiği yoğunluğu", "kötü amaçlı yazılım", "donanım hatası"]

platforms = ["Instagram", "LinkedIn", "Facebook", "Google Ads", "Twitter", "YouTube"]

audiences = ["genç profesyoneller", "teknoloji meraklıları", "kurumsal müşteriler", "küçük işletme sahipleri", "öğrenciler"]

numbers = ["250", "500", "750", "1000", "1500", "2000"]

brands = ["ABC Marka", "XYZ İşbirliği", "GlobalTech", "EcoBrands", "NextGen Solutions"]

metrics = ["%25 tıklama oranı artışı", "daha yüksek müşteri dönüşüm oranı", "%50 daha fazla erişim",
           "kampanya başarı oranı %90", "reklam görüntüleme sayısı 1M+"]

# Eksik değişkenler için yeni listeler
incident_types = ["iş güvenliği ihlali", "etik kural ihlali", "şirket politikası ihlali", 
                 "gizlilik ihlali", "davranış kuralları ihlali"]

decisions = ["yazılı uyarı", "sözlü uyarı", "görev değişikliği", 
            "eğitime yönlendirme", "işten çıkarma"]

new_positions = ["Kıdemli Uzman", "Takım Lideri", "Departman Müdürü", 
                "Proje Yöneticisi", "Birim Sorumlusu"]

violation_types = ["veri güvenliği", "iş sağlığı ve güvenliği", "çevre düzenlemeleri", 
                  "lisans anlaşmaları", "rekabet kuralları"]

case_subjects = ["fikri mülkiyet hakları", "iş sözleşmesi uyuşmazlığı", 
                "rekabet yasağı", "tazminat talebi", "lisans ihlali"]

verdicts = ["lehte sonuçlanmıştır", "aleyhte sonuçlanmıştır", "uzlaşma sağlanmıştır", 
            "dava düşmüştür", "temyize gidilmiştir"]

threat_types = ["virüs", "fidye yazılımı", "oltalama saldırısı", 
                "veri sızıntısı", "yetkisiz erişim"]

system_names = ["ERP", "CRM", "İK Yönetim Sistemi", "Doküman Yönetim Sistemi", 
                "Muhasebe Yazılımı"]

user_names = ["ahmet.yilmaz", "ayse.demir", "mehmet.kaya", "fatma.ozkan", 
              "ali.celik", "zeynep.korkmaz"]

device_names = ["LAP-001", "PC-002", "SRV-003", "WS-004", "NB-005"]

threat_counts = ["1", "2", "3", "5", "10"]

quarters = ["ilk", "ikinci", "üçüncü", "dördüncü"]

investment_projects = ["Dijital Dönüşüm", "Yeşil Enerji", "AR-GE Merkezi", 
                      "Üretim Hattı Modernizasyonu", "Veri Merkezi"]

risk_areas = ["operasyonel", "finansal", "teknolojik", "yasal uyum", "pazar"]

csr_projects = ["Eğitime Destek", "Çevre Koruma", "Toplum Sağlığı", 
                "Sosyal İnovasyon", "Engelsiz Yaşam"]

process_names = ["üretim", "kalite kontrol", "tedarik zinciri", 
                "müşteri hizmetleri", "AR-GE"]

standard_names = ["ISO 9001", "ISO 27001", "ISO 14001", "OHSAS 18001", "TSE"]

error_types = ["üretim hatası", "kalite sapması", "süreç uyumsuzluğu", 
               "dokümantasyon hatası", "ölçüm hatası"]

product_names = ["Ürün A", "Ürün B", "Ürün C", "Ürün D", "Ürün E"]

training_names = ["Liderlik Gelişimi", "Teknik Yetkinlik", "İş Güvenliği", 
                 "Kalite Yönetimi", "Kişisel Gelişim"]


module_names = ["Temel Eğitim", "İleri Seviye", "Uzmanlık", "Sertifikasyon"]

supplier_counts = ["3", "5", "7", "10", "15"]

best_suppliers = ["ABC Ltd.", "XYZ A.Ş.", "Global Tech", "EcoSupply", "SmartVendor"]

contract_dates = ["1 Ocak 2024", "1 Nisan 2024", "1 Temmuz 2024", "1 Ekim 2024"]

delay_reasons = ["tedarik zinciri aksaklığı", "üretim gecikmesi", "lojistik sorunlar", 
                "gümrük işlemleri", "force majeure"]

new_dates = ["15 Ocak", "15 Nisan", "25 Temmuz", "15 Ekim"]

issue_types = ["donanım arızası", "yazılım hatası", "ağ sorunu", 
               "güvenlik ihlali", "performans düşüklüğü"]

resolution_times = ["2", "4", "8", "12", "24"]

backup_systems = ["Yedekleme Sistemi A", "Bulut Yedekleme", "Fiziksel Yedekleme", 
                 "Hibrit Yedekleme", "Anlık Yedekleme"]
# Değişkenler listesine ekleyin (in[7] bölümüne)
change_dates = ["1 Ocak 2024", "15 Şubat 2024", "1 Mart 2024", "15 Nisan 2024", 
                "1 Mayıs 2024", "15 Haziran 2024", "1 Temmuz 2024", "15 Ağustos 2024"]
# Değişkenler listesine ekleyin (in[7] bölümüne)
incident_type = ["sistem kesintisi", "güvenlik ihlali", "veri kaybı", 
                "donanım arızası", "yazılım hatası", "ağ sorunu", 
                "kullanıcı hatası", "yetkisiz erişim"]
market_types = ["B2B", "B2C", "e-ticaret", "perakende", "toptan satış", 
                "kurumsal", "KOBİ", "uluslararası pazar", 
                "yerel pazar", "endüstriyel"]
vent_names = ["Yıllık Teknoloji Konferansı", "Kariyer Fuarı", "Liderlik Zirvesi", 
              "İnovasyon Günleri", "Sürdürülebilirlik Sempozyumu"]
# Rakip firma isimleri
ompetitor_names = ["Tech Corp", "Global Solutions", "Innovate Inc.", 
                  "Smart Systems", "Future Tech"]
# Değişiklik tarihleri (virgül hatası düzeltildi)
hange_dates = ["1 Ocak 2024", "15 Şubat 2024", "1 Mart 2024", "15 Nisan 2024", 
               "1 Mayıs 2024", "15 Haziran 2024", "1 Temmuz 2024", "15 Ağustos 2024"]
# Olay türleri (tekrar tanımlama düzeltildi)
ncident_types = ["sistem kesintisi", "güvenlik ihlali", "veri kaybı", 
                "donanım arızası", "yazılım hatası", "ağ sorunu", 
                "kullanıcı hatası", "yetkisiz erişim"]
# Pazar türleri
arket_types = ["B2B", "B2C", "e-ticaret", "perakende", "toptan satış", 
               "kurumsal", "KOBİ", "uluslararası pazar", 
               "yerel pazar", "endüstriyel"]

event_names = ["Yıllık Teknoloji Konferansı", "Kariyer Fuarı", "Liderlik Zirvesi", 
              "İnovasyon Günleri", "Sürdürülebilirlik Sempozyumu"]

competitor_names = ["Tech Corp", "Global Solutions", "Innovate Inc.", 
                  "Smart Systems", "Future Tech"]

bank_names = ["X Bank", "Y Bank", "Z Bank", "A Bank", "B Bank"]

transaction_types = ["EFT", "Havale", "Ödeme", "Tahsilat", "Yatırım"]
installments = ["3", "6", "12", "24", "36"]
period = ["Ocak-Mart", "Nisan-Haziran", "Temmuz-Eylül", "Ekim-Aralık"]

Bu kod, her departman için 40 belge oluşturarak toplamda 360 sentetik belge üretir. İçerikler, tanımlı değişkenlerden rastgele seçilen değerlerle doldurulur (ör. {name}, {date}). Her belge, departman adı, başlık ve dinamik olarak oluşturulan içerik bilgilerini içerir. Amaç, yapay zekâ eğitimine uygun bir veri seti oluşturmaktır.

In [196]:
# Veri setini oluşturma

data = []
for unit, documents in titles_contents.items():
    for _ in range(40):  # Her birim için 40 belge
        title, content = random.choice(documents)
        content = content.format(
    name=random.choice(names),
    date=random.choice(dates),
    reason=random.choice(reasons),
    department=random.choice(departments),
    supplier=random.choice(suppliers),
    item_list=random.choice(items),
    amount=random.choice(amounts),
    income=random.choice(income),
    expense=random.choice(expense),
    device_type=random.choice(device_types),
    issue=random.choice(issues),
    start_date=random.choice(start_dates),
    end_date=random.choice(end_dates),
    deadline=random.choice(deadlines),
    rating=random.choice(ratings),
    supervisor=random.choice(supervisors),
    training_type=random.choice(training_types),
    complaint_type=random.choice(complaint_types),
    lawyer_name=random.choice(lawyer_names),
    cause=random.choice(causes),
    platform=random.choice(platforms),
    audience=random.choice(audiences),
    market_type=random.choice(market_types),
    number=random.choice(numbers),
    brand=random.choice(brands),
    metric=random.choice(metrics),
    case_type=random.choice(case_types),
    contract_type=random.choice(contract_types),
    software_name=random.choice(software_names),
    incident=random.choice(incident_types),
    decision=random.choice(decisions),
    new_position=random.choice(new_positions),
    violation_type=random.choice(violation_types),
    case_subject=random.choice(case_subjects),
    verdict=random.choice(verdicts),
    threat_type=random.choice(threat_types),
    system_name=random.choice(system_names),
    user_name=random.choice(user_names),
    device_name=random.choice(device_names),
    threat_count=random.choice(threat_counts),
    quarter=random.choice(quarters),
    investment_project=random.choice(investment_projects),
    risk_area=random.choice(risk_areas),
    csr_project=random.choice(csr_projects),
    process_name=random.choice(process_names),
    standard_name=random.choice(standard_names),
    error_type=random.choice(error_types),
    product_name=random.choice(product_names),
    training_name=random.choice(training_names),
    module_name=random.choice(module_names),
    supplier_count=random.choice(supplier_counts),
    best_supplier=random.choice(best_suppliers),
    contract_date=random.choice(contract_dates),
    delay_reason=random.choice(delay_reasons),
    incident_type=random.choice(incident_type),
    new_date=random.choice(new_dates),
    issue_type=random.choice(issue_types),
    resolution_time=random.choice(resolution_times),
    backup_system=random.choice(backup_systems),
    change_date=random.choice(change_dates),
    event_name=random.choice(event_names),
    competitor_name=random.choice(competitor_names),
    period=random.choice(period),
   installments=random.choice(installments),
   bank_name=random.choice(bank_names),
   transaction_type=random.choice(transaction_types)
)
        data.append({
            "Belge ID": len(data) + 1,
            "Birim": unit,
            "Belge Başlığı": title,
            "Belge İçeriği": content
        })


Bu kod, data listesindeki sentetik verileri bir pandas DataFrame formatına dönüştürür. Dönüştürülen veri, veri_seti_supervisor.csv adlı dosyaya indekssiz ve UTF-8 kodlamasıyla kaydedilir. Dosya, her belgeyi bir satır olarak içerir. Son olarak, veri setinin başarıyla oluşturulduğuna dair bir mesaj yazdırır.

In [198]:
# DataFrame ve CSV Kaydetme

df = pd.DataFrame(data)
df.to_csv("veri_seti_supervisor.csv", index=False, encoding="utf-8-sig")
print("Supervisor destekli veri seti oluşturuldu: 'veri_seti_supervisor.csv'")

Supervisor destekli veri seti oluşturuldu: 'veri_seti_supervisor.csv'
