# Calorie Estimation: Data Analysis and Modeling
This notebook covers the steps of data analysis, feature engineering, and machine learning modeling for the calorie estimation competition.

In [2]:
# Gerekli kütüphaneleri yükle
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

ModuleNotFoundError: No module named 'pandas'

## 1. Veriyi Yükleme ve İlk İnceleme

In [None]:
# Verileri oku
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

# İlk 5 satırı göster
train.head()

In [None]:
# Test setinin ilk 5 satırı
test.head()

In [None]:
# Sütun isimleri ve veri tipleri
print('Train sütunları:', train.columns.tolist())
print('Test sütunları:', test.columns.tolist())
train.info()

In [None]:
# Eksik değer kontrolü
print('Eksik değerler (train):')
print(train.isnull().sum())
print('Eksik değerler (test):')
print(test.isnull().sum())

In [None]:
# Temel istatistikler
train.describe()

## 2. Hedef Değişkeni Analizi

In [None]:
# Hedef değişkenin dağılımı
plt.figure(figsize=(8,4))
sns.histplot(train['Calories'], bins=50, kde=True)
plt.title('Calories Dağılımı')
plt.xlabel('Calories')
plt.show()

## 3. Özellik Analizi ve Korelasyon

In [None]:
# Korelasyon matrisi
plt.figure(figsize=(10,8))
sns.heatmap(train.corr(), annot=True, fmt='.2f', cmap='coolwarm')
plt.title('Korelasyon Matrisi')
plt.show()

## 4. Basit Modelleme (LightGBM ile)

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_log_error
import lightgbm as lgb

# Özellik ve hedef değişkenleri ayır
X = train.drop(['Calories', 'id'], axis=1)
y = train['Calories']

# Eğitim ve doğrulama seti
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)

# Modeli eğit
model = lgb.LGBMRegressor(random_state=42)
model.fit(X_train, y_train)

# Doğrulama tahmini
val_pred = model.predict(X_val)

# RMSLE hesapla
rmsle = np.sqrt(mean_squared_log_error(y_val, val_pred))
print(f'Validation RMSLE: {rmsle:.5f}')

## 5. Test Seti için Tahmin ve Submission Dosyası Oluşturma

In [None]:
# Test seti için tahmin
X_test = test.drop(['id'], axis=1)
test_pred = model.predict(X_test)

# Submission dosyası
submission = pd.DataFrame({'id': test['id'], 'Calories': test_pred})
submission.to_csv('submission.csv', index=False)
submission.head()

Yarışma için submission.csv dosyası oluşturulmuştur. Modeli geliştirmek için özellik mühendisliği, hiperparametre optimizasyonu ve ensemble yöntemleri ekleyebilirsin.