In [2]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

In [3]:
# Memuat data ke dalam DataFrame
house_data = pd.read_csv('house_listings.csv')

# Menampilkan beberapa baris pertama data
print(house_data.head())


       category    price currency     price_1m2  \
0  Köhnə tikili  137 000      AZN  2 630 AZN/m²   
1   Yeni tikili  183 000      AZN  1 790 AZN/m²   
2  Köhnə tikili  145 000      AZN  2 230 AZN/m²   
3  Köhnə tikili  190 000      AZN  2 000 AZN/m²   
4   Yeni tikili  294 000      AZN  1 550 AZN/m²   

                                               title  \
0  Satılır 3 otaqlı köhnə tikili 52 m², 8-ci kilo...   
1  Satılır 2 otaqlı yeni tikili 102 m², Neftçilər m.   
2  Satılır 2 otaqlı köhnə tikili 65 m², Nərimanov r.   
3    Satılır 3 otaqlı köhnə tikili 95 m², Gənclik m.   
4     Satılır 3 otaqlı yeni tikili 190 m², Nəsimi r.   

                    address   floor    area title_deed  repair mortgage  \
0  Elşən Süleymanov küç 137   7 / 9   52 m²        var     var      NaN   
1      Mehdi Abbasov küçəsi  2 / 17  102 m²     yoxdur     var      NaN   
2         Atatürk Prospekti   6 / 9   65 m²        var     var      var   
3               Atatürk pr.   4 / 9   95 m²        var  

In [4]:
# Membersihkan kolom 'price' dari karakter non-numerik dan mengubahnya menjadi float
house_data['price'] = house_data['price'].str.replace(' ', '').astype(float)

# Membersihkan kolom 'price_1m2' dari karakter non-numerik dan mengubahnya menjadi float
house_data['price_1m2'] = house_data['price_1m2'].str.replace(' AZN/m²', '').str.replace(' ', '').astype(float)


In [5]:
# Langkah 2: Normalisasi harga rumah dan harga per meter persegi menggunakan Min-Max scaling
scaler = MinMaxScaler()
house_data[['price', 'price_1m2']] = scaler.fit_transform(house_data[['price', 'price_1m2']])

In [6]:
print(house_data.head())

       category     price currency  price_1m2  \
0  Köhnə tikili  0.021298      AZN   0.116922   
1   Yeni tikili  0.030369      AZN   0.076321   
2  Köhnə tikili  0.022875      AZN   0.097588   
3  Köhnə tikili  0.031749      AZN   0.086471   
4   Yeni tikili  0.052258      AZN   0.064720   

                                               title  \
0  Satılır 3 otaqlı köhnə tikili 52 m², 8-ci kilo...   
1  Satılır 2 otaqlı yeni tikili 102 m², Neftçilər m.   
2  Satılır 2 otaqlı köhnə tikili 65 m², Nərimanov r.   
3    Satılır 3 otaqlı köhnə tikili 95 m², Gənclik m.   
4     Satılır 3 otaqlı yeni tikili 190 m², Nəsimi r.   

                    address   floor    area title_deed  repair mortgage  \
0  Elşən Süleymanov küç 137   7 / 9   52 m²        var     var      NaN   
1      Mehdi Abbasov küçəsi  2 / 17  102 m²     yoxdur     var      NaN   
2         Atatürk Prospekti   6 / 9   65 m²        var     var      var   
3               Atatürk pr.   4 / 9   95 m²        var     var      

In [7]:
print(house_data.tail())

           category     price currency  price_1m2  \
35498  Köhnə tikili  0.020903      AZN   0.090338   
35499   Yeni tikili  0.042595      AZN   0.121272   
35500   Yeni tikili  0.055216      AZN   0.101455   
35501   Yeni tikili  0.051864      AZN   0.093721   
35502  Köhnə tikili  0.019917      AZN   0.094688   

                                                   title              address  \
35498  Satılır 2 otaqlı köhnə tikili 65 m², 9-cu mikr...     Mir Cəlal küçəsi   
35499      Satılır 2 otaqlı yeni tikili 90 m², 28 May m.   Dilarə Əliyeva küç   
35500     Satılır 3 otaqlı yeni tikili 134 m², Nizami m.    Ağadadaş Qurbanov   
35501  Satılır 3 otaqlı yeni tikili 136 m², Şah İsmay...    Xocalı prospekti.   
35502  Satılır 3 otaqlı köhnə tikili 60 m², Qara Qara...  Q.Qarayev prospekti   

         floor    area title_deed repair mortgage  \
35498    3 / 9   65 m²        var    var      var   
35499   7 / 13   90 m²        var    NaN      NaN   
35500  13 / 18  134 m²        var  

In [8]:
house_data = pd.get_dummies(house_data, columns=['category', 'title_deed',  'repair', 'mortgage'])


In [9]:
print(house_data.head(10))


      price currency  price_1m2  \
0  0.021298      AZN   0.116922   
1  0.030369      AZN   0.076321   
2  0.022875      AZN   0.097588   
3  0.031749      AZN   0.086471   
4  0.052258      AZN   0.064720   
5  0.011438      AZN   0.083088   
6  0.102741      AZN   0.112089   
7  0.018931      AZN   0.094205   
8  0.023861      AZN   0.121756   
9  0.006508      AZN   0.062787   

                                               title  \
0  Satılır 3 otaqlı köhnə tikili 52 m², 8-ci kilo...   
1  Satılır 2 otaqlı yeni tikili 102 m², Neftçilər m.   
2  Satılır 2 otaqlı köhnə tikili 65 m², Nərimanov r.   
3    Satılır 3 otaqlı köhnə tikili 95 m², Gənclik m.   
4     Satılır 3 otaqlı yeni tikili 190 m², Nəsimi r.   
5     Satılır 1 otaqlı köhnə tikili 45 m², Nəsimi m.   
6  Satılır 5 otaqlı yeni tikili 217 m², Nəriman N...   
7  Satılır 2 otaqlı yeni tikili 58 m², Yeni Yasam...   
8     Satılır 2 otaqlı köhnə tikili 55 m², Nizami m.   
9     Satılır 2 otaqlı yeni tikili 41 m², Masazır q.  

In [10]:
aggregated_data = house_data.groupby(['room_number', 'category_Köhnə tikili', 'category_Yeni tikili']).agg({'price': ['mean', 'median', lambda x: x.mode()[0]]})
aggregated_data.columns = ['avg_price', 'median_price', 'mode_price']

In [11]:
# Menyimpan hasil aggregasi ke file CSV
aggregated_data.to_csv('aggregated_data.csv')

# Menampilkan hasil aggregasi
print(aggregated_data)

                                                        avg_price  \
room_number category_Köhnə tikili category_Yeni tikili              
1.0         False                 True                   0.018380   
            True                  False                  0.012295   
2.0         False                 True                   0.026653   
            True                  False                  0.017951   
3.0         False                 True                   0.044644   
            True                  False                  0.027152   
4.0         False                 True                   0.074255   
            True                  False                  0.036024   
5.0         False                 True                   0.118087   
            True                  False                  0.048823   
6.0         False                 True                   0.160358   
            True                  False                  0.117555   
7.0         False                 