In [2]:
import pandas as pd
import numpy as np
import random

# Veri sayısı
n_samples = 5000

# Temel gıda kategorileri ve besin değeri aralıkları
# (enerji(kcal), yağ(g), doymuş_yağ(g), karbonhidrat(g), şeker(g), lif(g), protein(g))
food_categories = {
    'Bisküvi': [(350, 500), (15, 25), (7, 12), (45, 65), (15, 25), (1, 3), (5, 8)],
    'Çikolata': [(500, 600), (30, 40), (15, 20), (50, 60), (45, 55), (2, 4), (6, 9)],
    'Cips': [(450, 550), (25, 35), (10, 15), (50, 60), (1, 3), (3, 5), (6, 8)],
    'Kraker': [(400, 450), (12, 18), (5, 8), (65, 75), (2, 5), (2, 4), (8, 10)],
    'Gofret': [(450, 550), (25, 30), (12, 18), (55, 65), (30, 40), (1, 2), (4, 6)],
    'Kek': [(350, 450), (15, 25), (8, 12), (50, 60), (25, 35), (1, 3), (5, 8)],
    'Şekerleme': [(300, 400), (0, 2), (0, 1), (70, 80), (60, 70), (0, 1), (0, 2)],
    'Dondurma': [(200, 300), (10, 15), (6, 10), (25, 35), (20, 30), (0, 1), (3, 5)],
    'Gazlı İçecek': [(120, 150), (0, 0), (0, 0), (30, 35), (30, 35), (0, 0), (0, 0)],
    'Meyve Suyu': [(100, 130), (0, 0), (0, 0), (25, 30), (20, 25), (0, 1), (0, 1)]
}

# Boş listeler
data = {
    'Yiyecek': [],
    'Enerji_kcal': [],
    'Yağ_g': [],
    'Doymuş_Yağ_g': [],
    'Karbonhidrat_g': [],
    'Şeker_g': [],
    'Lif_g': [],
    'Protein_g': [],
    'Gereken_Adım': [],
    'Yürüme_Süresi_Dk': [],
    'Mesafe_KM': []
}

# Veri üretimi
for _ in range(n_samples):
    category = random.choice(list(food_categories.keys()))
    ranges = food_categories[category]
    
    # Besin değerlerini üret
    enerji = round(random.uniform(ranges[0][0], ranges[0][1]), 1)
    yag = round(random.uniform(ranges[1][0], ranges[1][1]), 1)
    doymus_yag = round(random.uniform(ranges[2][0], ranges[2][1]), 1)
    karbonhidrat = round(random.uniform(ranges[3][0], ranges[3][1]), 1)
    seker = round(random.uniform(ranges[4][0], ranges[4][1]), 1)
    lif = round(random.uniform(ranges[5][0], ranges[5][1]), 1)
    protein = round(random.uniform(ranges[6][0], ranges[6][1]), 1)
    
    # Adım hesaplama
    # Kalori başına gereken adım sayısı (metabolik faktörlere göre ayarlanmış)
    base_steps = random.uniform(20, 25)  # Temel adım faktörü
    yag_factor = 1.2  # Yağ için ek faktör
    protein_factor = 0.8  # Protein için ek faktör
    
    total_steps = round(enerji * base_steps * 
                       (1 + (yag * yag_factor + protein * protein_factor) / 100))
    
    # Yürüme süresi ve mesafe hesaplama
    walking_time = round(total_steps / 100, 1)  # Ortalama 100 adım/dakika
    distance = round((total_steps * 0.7) / 1000, 2)  # Ortalama adım uzunluğu 0.7m
    
    # Verileri sözlüğe ekle
    data['Yiyecek'].append(category)
    data['Enerji_kcal'].append(enerji)
    data['Yağ_g'].append(yag)
    data['Doymuş_Yağ_g'].append(doymus_yag)
    data['Karbonhidrat_g'].append(karbonhidrat)
    data['Şeker_g'].append(seker)
    data['Lif_g'].append(lif)
    data['Protein_g'].append(protein)
    data['Gereken_Adım'].append(total_steps)
    data['Yürüme_Süresi_Dk'].append(walking_time)
    data['Mesafe_KM'].append(distance)

# DataFrame oluştur
df = pd.DataFrame(data)

# CSV dosyasına kaydet
df.to_csv('veri.csv', index=False)

# İlk 5 satırı göster
print(df.head())


        Yiyecek  Enerji_kcal  Yağ_g  Doymuş_Yağ_g  Karbonhidrat_g  Şeker_g  \
0           Kek        358.8   23.8           8.2            57.2     30.3   
1    Meyve Suyu        112.6    0.0           0.0            25.3     24.1   
2  Gazlı İçecek        145.7    0.0           0.0            31.4     33.8   
3      Dondurma        252.9   11.2           8.6            31.3     29.4   
4       Bisküvi        371.0   21.8           7.5            51.6     23.4   

   Lif_g  Protein_g  Gereken_Adım  Yürüme_Süresi_Dk  Mesafe_KM  
0    2.1        5.3         10908             109.1       7.64  
1    0.2        0.7          2459              24.6       1.72  
2    0.0        0.0          2939              29.4       2.06  
3    1.0        3.7          6163              61.6       4.31  
4    2.9        7.0          9979              99.8       6.99  
