# Analýza Trhu s Byty (EDA & Modelování)

Tento notebook slouží k explorativní analýze dat (EDA) stažených z realitních portálů a experimentování s trénováním modelu pro predikci cen bytů.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import sys
import os

# Přidání kořenového adresáře do cesty pro importy
sys.path.append(os.path.abspath(os.path.join(os.getcwd(), '..')))

from src.model.train_model import load_data, clean_data, train_model

%matplotlib inline

## 1. Načtení Dat

In [None]:
df = load_data('../data/raw/apartments_raw_data.csv')
print(f"Načteno {len(df)} inzerátů.")
df.head()

## 2. Čištění a Extrakce Rysů

In [None]:
df_clean = clean_data(df)
print(f"Po vyčištění zbývá {len(df_clean)} inzerátů.")
df_clean.head()

## 3. Vizualizace Dat

### Rozdělení cen podle krajů

In [None]:
plt.figure(figsize=(12, 6))
sns.boxplot(x='region', y='price', data=df_clean)
plt.xticks(rotation=45)
plt.title('Distribuce cen bytů podle krajů')
plt.show()

### Vztah mezi plochou a cenou

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(x='area', y='price', hue='region', data=df_clean, alpha=0.6)
plt.title('Cena vs. Plocha bytu')
plt.xlabel('Plocha (m²)')
plt.ylabel('Cena (Kč)')
plt.show()

## 4. Trénování Modelu

In [None]:
model, accuracy = train_model('../data/raw/apartments_raw_data.csv')
print(f"Model natrénován s přesností (R2 skóre): {accuracy:.2f}")