# HDF5 → Parquet Dönüşümü
Bu notebook, HDF5 dosyasındaki bir dataset'i Parquet formatına dönüştürmek için örnek kullanım sunar.

In [None]:
from pathlib import Path
from src.utils.h5_utils import h5_to_parquet, list_h5_structure
import pandas as pd
import h5py
from src import config


## 1. HDF5 Dosya Yapısını İnceleyin
Önce dosya içindeki veri yapısını keşfedin.

In [None]:
h5_path = config.DATA_RAW / 'ornek.h5'  # HDF5 dosya yolunu güncelleyin
list_h5_structure(h5_path)

## 2. Dataset'i Parquet'e Dönüştürün
Aşağıdaki örnekte, 'mygroup/mydataset' anahtarındaki veriler Parquet'e çevrilir. Kolon isimleri ve indeks sütunu opsiyoneldir. Büyük dosyalar için parça parça (chunk) okuma da yapılabilir.

In [None]:
# Parametreleri dosyaniza gore degistirin
h5_path = config.DATA_RAW / 'ornek.h5'
parquet_path = config.DATA_PROCESSED / 'out/block0_values.parquet'
dataset_key = 't/block0_values'
timestamp_key = 't/axis1'
sensor_key = 't/axis0'
chunk_rows = None  # veya ornek 10000
with h5py.File(h5_path, 'r') as f:
    columns = f[sensor_key][:].astype(str).tolist()

h5_to_parquet(
    h5_path=h5_path,
    parquet_path=parquet_path,
    dataset_key=dataset_key,
    timestamp_key=timestamp_key,
    columns=columns,
    chunk_rows=chunk_rows,
)


## 3. Parquet Dosyasını Kontrol Edin
Dönüşüm sonrası Parquet dosyasını okuyup kontrol edebilirsiniz.

In [None]:
df = pd.read_parquet(parquet_path)
df.head()