In [None]:
# Gerekli Kütüphanelerin İmport Edilmesi
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split  
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.ensemble import RandomForestRegressor  
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score


Pandas’a dair temel komutlarla bir giriş yaparak, seaborn ve matplotlib kullanarak veriyi görselleştirelim:

In [None]:
# Veri setini yükleyelim
rent_df = pd.read_csv("/kaggle/input/house-rent-prediction-dataset/House_Rent_Dataset.csv")
rent_df.sample(5)


In [None]:
Veri Setinin Şekli ve Sütunları:



In [None]:
# Veri setinin şekli
print(rent_df.shape)

# Sütunlar
print(rent_df.columns)


In [None]:
# Veri seti hakkında bilgi
rent_df.info()

# Eksik veri kontrolü
print(rent_df.isnull().sum())


In [None]:
# Veri setinin istatistiksel özetini inceleyelim
rent_df.describe()


In [None]:
# Veri setinin istatistiksel özetini inceleyelim
rent_df.describe()


Ev Kirasının Ortalaması, Medyanı, Maksimum ve Minimum Değerleri:


In [None]:
# Ev kiralarının istatistiksel bilgileri
print("Ortalama Ev Kirası:", round(rent_df["Rent"].mean()))
print("Medyan Ev Kirası:", round(rent_df["Rent"].median()))
print("En Yüksek Ev Kirası:", round(rent_df["Rent"].max()))
print("En Düşük Ev Kirası:", round(rent_df["Rent"].min()))


In [None]:
# En yüksek 5 ev kirası
print(rent_df["Rent"].sort_values(ascending=False).head(5))

# En düşük 5 ev kirası
print(rent_df["Rent"].sort_values().head(5))


4- Veri Temizleme ve Ön İşleme
Bu adımda, veri setindeki eksik veriler, duplikalar ve gereksiz sütunlar kontrol edilecek ve gerekli temizlik işlemleri 

In [None]:
# Veri setinde eksik değer olup olmadığını kontrol edelim
print(rent_df.isnull().sum())

# Veri setindeki duplikaların kontrolü
print(rent_df.duplicated().sum())

# Tarih sütununu işleyelim
if 'Posted On' in rent_df.columns:
    rent_df['Year'] = pd.to_datetime(rent_df['Posted On']).dt.year
    rent_df['Month'] = pd.to_datetime(rent_df['Posted On']).dt.month
    rent_df['Day'] = pd.to_datetime(rent_df['Posted On']).dt.day
    rent_df.drop('Posted On', axis=1, inplace=True)


In [None]:
# Kategorik değişkenleri sayısal hale getirelim
X = pd.get_dummies(rent_df.drop('Rent', axis=1), drop_first=True)
y = rent_df['Rent']


In [None]:
# Ev kiralarının dağılımını inceleyelim
sns.histplot(rent_df['Rent'], kde=True, color='blue')
plt.title("Ev Kiralarının Dağılımı")
plt.xlabel("Ev Kirası")
plt.ylabel("Frekans")
plt.show()


Şehir Bazında Kiralık Ev Sayısı:


In [None]:
# Şehirler bazında kiralık ev sayısını görselleştirelim
plt.figure(figsize=(20, 6))
ax = rent_df["City"].value_counts().plot(kind='bar', color='navy', rot=0)

for p in ax.patches:
    ax.annotate(int(p.get_height()), (p.get_x() + 0.25, p.get_height() - 100),
                ha='center', va='bottom', color='white')

plt.title("Her Şehirdeki Kiralık Ev Sayısı")
plt.xlabel("Şehir")
plt.ylabel("Ev Sayısı")
plt.show()


In [None]:
# Mobilyalı/mobilyasız evlerin sayısını görselleştirelim
plt.figure(figsize=(20, 6))
ax = rent_df["Furnishing Status"].value_counts().plot(kind='bar', color='coral', rot=0)

for p in ax.patches:
    ax.annotate(int(p.get_height()), (p.get_x() + 0.25, p.get_height() - 250),
                ha='center', va='bottom', color='black')

plt.title("Furnishing Durumuna Göre Ev Sayısı")
plt.xlabel("Furnishing Durumu")
plt.ylabel("Ev Sayısı")
plt.show()


6- Sonuç ve Öneriler
Bu adımda, elde edilen analizler ışığında ev kiraları ve piyasadaki değişkenler arasındaki ilişkiler değerlendirilerek, modelin gelişimine yönelik önerilerde bulunulacaktır.

Öneriler:

Ev Fiyat Tahmin Modelleri: Bu projede, kiralık ev fiyatlarını tahmin etmek için regresyon modelleri kullanılabilir. Özellikle Linear Regression veya Random Forest Regressor gibi modeller ile tahmin yapılabilir.
Model Seçimi: Ev fiyatlarını tahmin etmek için, karmaşık ilişkiler ve etkileşimler nedeniyle Random Forest Regressor daha iyi sonuç verebilir. Bu model, doğrusal olmayan ilişkileri ve etkileşimleri modelleyebilir.