In [1]:
import pandas as pd
import random
import string

# 📥 CSV dosyasını oku (örnek: veri.csv)
df = pd.read_csv("healthcare_dataset.csv")


# 🇺🇸 ABD formatında SSN (Kimlik No) üretici
def generate_us_ssn():
    area = random.randint(100, 899)
    group = random.randint(10, 99)
    serial = random.randint(1000, 9999)
    return f"{area:03d}-{group:02d}-{serial:04d}"

# 📧 E-posta adresi üretici
def generate_email():
    username = ''.join(random.choices(string.ascii_lowercase + string.digits, k=8))
    domain = random.choice(['gmail.com', 'yahoo.com', 'outlook.com'])
    return f"{username}@{domain}"

# ☎️ Amerikan formatında telefon numarası üretici
def generate_us_phone():
    area_code = random.choice(['202', '303', '415', '512', '617', '718'])  # ABD şehir kodları
    prefix = random.randint(200, 999)
    line_number = random.randint(1000, 9999)
    return f"+1-{area_code}-{prefix}-{line_number}"

# 🧩 Yeni sütunları oluştur
df["SSN"] = [generate_us_ssn() for _ in range(df.shape[0])]              # Social Security Number
df["Email"] = [generate_email() for _ in range(df.shape[0])]
df["Phone Number"] = [generate_us_phone() for _ in range(df.shape[0])]

# 📤 Sonuçları CSV olarak kaydetmek istersen:
df.to_csv("genisletilmis_veri.csv", index=False)

In [2]:
# ✅ Sonuçları gör
df.head()

Unnamed: 0,Name,Age,Gender,Blood Type,Medical Condition,Date of Admission,Doctor,Hospital,Insurance Provider,Billing Amount,Room Number,Admission Type,Discharge Date,Medication,Test Results,SSN,Email,Phone Number
0,Bobby JacksOn,30,Male,B-,Cancer,2024-01-31,Matthew Smith,Sons and Miller,Blue Cross,18856.281306,328,Urgent,2024-02-02,Paracetamol,Normal,765-65-4588,vewzdhv7@yahoo.com,+1-303-270-4528
1,LesLie TErRy,62,Male,A+,Obesity,2019-08-20,Samantha Davies,Kim Inc,Medicare,33643.327287,265,Emergency,2019-08-26,Ibuprofen,Inconclusive,731-83-4378,3ucl2gb7@gmail.com,+1-202-544-8306
2,DaNnY sMitH,76,Female,A-,Obesity,2022-09-22,Tiffany Mitchell,Cook PLC,Aetna,27955.096079,205,Emergency,2022-10-07,Aspirin,Normal,132-47-8397,lm3ddoep@yahoo.com,+1-415-794-1886
3,andrEw waTtS,28,Female,O+,Diabetes,2020-11-18,Kevin Wells,"Hernandez Rogers and Vang,",Medicare,37909.78241,450,Elective,2020-12-18,Ibuprofen,Abnormal,772-99-8085,agavrgvu@outlook.com,+1-617-818-7115
4,adrIENNE bEll,43,Female,AB+,Cancer,2022-09-19,Kathleen Hanna,White-White,Aetna,14238.317814,458,Urgent,2022-10-09,Penicillin,Abnormal,594-86-3065,eyilm821@yahoo.com,+1-512-904-2823


In [None]:
import streamlit as st
import pandas as pd
import ollama

st.set_page_config(page_title="LLM Veri Mahremiyet Analizi", layout="wide")
st.title("🔐 LLM ile Sağlık & Kişisel Veri Gizlilik Analizi")

# Dizindeki sabit veri seti dosyası
DATASET_PATH = "genisletilmis_veri.csv"

try:
    df = pd.read_csv(DATASET_PATH)
    st.subheader("📋 Veri Seti (veri.csv)")
    st.dataframe(df, use_container_width=True)

    if st.button("🔍 LLM ile Gizlilik Analizi Yap"):
        with st.spinner("LLM analiz yapıyor..."):
            sample_data = df.head(3).to_dict(orient="records")

            prompt = f"""
Aşağıda bir sağlık veri setinden örnek kayıtlar verilmektedir.
Bu verileri aşağıdaki düzenlemelere göre analiz et:
- PII (Kişisel Tanımlayıcı Bilgi)
- HIPAA (Sağlık Bilgileri)
- GDPR ve KVKK (Kişisel Verilerin Korunması)
- PCI DSS (Finansal Bilgi)

Lütfen şunları belirt:
1. Hangi alanlar hangi regülasyona aykırıdır?
2. Neden aykırıdır?
3. Gerekirse nasıl temizlenmelidir? (Anonimleştirme/maskeleme önerisi)
4. Temizleme sonrası hangi regülasyonlara uyum sağlanır?

Veri:
{sample_data}
"""

            try:
                response = ollama.chat(model="llama3", messages=[
                    {"role": "user", "content": prompt}
                ])

                st.success("✅ Analiz tamamlandı")
                st.markdown("### 🧠 LLM Yanıtı")
                st.markdown(response['message']['content'])

            except Exception as e:
                st.error(f"Hata oluştu: {e}")

except FileNotFoundError:
    st.error("❌ 'veri.csv' adlı dosya dizinde bulunamadı. Lütfen aynı klasöre ekleyin.")


ModuleNotFoundError: No module named 'ollama'

In [6]:
import sys
print(sys.executable)

c:\Users\sagla\AppData\Local\Programs\Python\Python39\python.exe
