<!-- # Explore the Dataset

In this notebook, we will explore the collected satellite imagery datasets around the world. We focus on earthquake influenced area. The dataset is obtained from `xBD: A Dataset for Assessing Building Damage from Satellite Imagery`. [![arXiv](https://img.shields.io/badge/arXiv-1911.09296-b31b1b.svg)](https://arxiv.org/abs/1911.09296)

xBD provides pre- and post-event multi-band satellite imagery from a variety of disaster events with building polygons, classification labels for damage types, ordinal labels of damage level, and corresponding satellite metadata. Furthermore, the dataset contains bounding boxes and labels for environmental factors such as fire, water, and smoke. xBD will be the largest building damage assessment dataset to date, containing ∼700,000 building annotations across over 5,000 km2 of imagery from 15 countries.

*Reference:*

Gupta, R., Hosfelt, R., Sajeev, S., Patel, N., Goodman, B., Doshi, J., Heim, E., Choset, H., & Gaston, M. (2019, November 21). xBD: A Dataset for Assessing Building Damage from Satellite Imagery. -->

# Veri Seti

Bu defterde dünya çapında toplanan uydu görüntüleri veri setini inceleyeceğiz. Depremden etkilenen bölgelere odaklanıyoruz. Veri seti `xBD: A Dataset for Assessing Building Damage from Satellite Imagery`'nden elde edilmiştir. [![arXiv](https://img.shields.io/badge/arXiv-1911.09296-b31b1b.svg)](https://arxiv.org/abs/1911.09296)

xBD, bina poligonları, hasar türleri için sınıflandırma etiketleri, hasar düzeyi sıralı etiketleri ve ilgili uydu meta verileriyle çeşitli afet olaylarından olay öncesi ve sonrası çok bantlı uydu görüntüleri sağlar. Ayrıca veri kümesi, yangın, su ve duman gibi çevresel faktörler için sınırlayıcı kutular ve etiketler içerir. xBD, 15 ülkeden 5.000 km2'den fazla görüntüde yaklaşık 700.000 bina açıklaması içeren bugüne kadarki en büyük bina hasarı değerlendirme veri seti olacak.

*Referans:*

Gupta, R., Hosfelt, R., Sajeev, S., Patel, N., Goodman, B., Doshi, J., Heim, E., Choset, H., & Gaston, M. (2019, November 21). xBD: A Dataset for Assessing Building Damage from Satellite Imagery.

## 1. Python paketleri yükleme

In [1]:
import pandas as pd
import ipywidgets as widgets
from ipywidgets import interact

import utils

print('Tüm paketler başarıyla yüklendi')

Tüm paketler başarıyla içe yüklendi


## 2. Veriseti gözden geçirmesi

Veriseti hakkında daha iyi bilgi edinmek için görüntüyü ve konumunu görüntülüyoruz

In [2]:
components = utils.images_on_server(display)

display(components['fileChooser'])

display(components['output'])

FileChooser(path='D:\Ders\Donem 7\Tasarim\project\damage-assessment\data\test', filename='', title='', show_hi…

HBox(children=(Output(layout=Layout(height='400px', width='30%')), Output(layout=Layout(height='400px', width=…

## 3. Veriseti Hazırlanması

```
|- data
  |- train
    |- visible_damage
    |- no_damage
  |- validation
    |- visible_damage
    |- no_damage
  |- test
    |- visible_damage
    |- no_damage
```

In [3]:
metadata = utils.get_dataframe_from_file_structure()

# Display the first five rows of the dataset
metadata

Unnamed: 0,subset,label,loc,no,lon,lat,path,filename
0,train,visible_damage,mexico-earthquake,00000000,disaster,post,train\visible_damage\mexico-earthquake_0000000...,mexico-earthquake_00000000_post_disaster.png
1,train,visible_damage,mexico-earthquake,00000001,disaster,post,train\visible_damage\mexico-earthquake_0000000...,mexico-earthquake_00000001_post_disaster.png
2,train,visible_damage,mexico-earthquake,00000002,disaster,post,train\visible_damage\mexico-earthquake_0000000...,mexico-earthquake_00000002_post_disaster.png
3,train,visible_damage,mexico-earthquake,00000003,disaster,post,train\visible_damage\mexico-earthquake_0000000...,mexico-earthquake_00000003_post_disaster.png
4,train,visible_damage,mexico-earthquake,00000004,disaster,post,train\visible_damage\mexico-earthquake_0000000...,mexico-earthquake_00000004_post_disaster.png
...,...,...,...,...,...,...,...,...
623,test,no_damage,palu-tsunami,00000181,disaster,pre,test\no_damage\palu-tsunami_00000181_pre_disas...,palu-tsunami_00000181_pre_disaster.png
624,test,no_damage,palu-tsunami,00000184,disaster,pre,test\no_damage\palu-tsunami_00000184_pre_disas...,palu-tsunami_00000184_pre_disaster.png
625,test,no_damage,palu-tsunami,00000185,disaster,pre,test\no_damage\palu-tsunami_00000185_pre_disas...,palu-tsunami_00000185_pre_disaster.png
626,test,no_damage,palu-tsunami,00000193,disaster,pre,test\no_damage\palu-tsunami_00000193_pre_disas...,palu-tsunami_00000193_pre_disaster.png


## 4. Verileri incelenmesi

Üç bölümün (train, val ve test) her biri için kategorilerin (hasarlı ve hasarsız) her biri için kaç görselimiz olduğuna bakabiliriz

### 4.1 Veriseti bölünmesinde görüntü dağıtımını anlamak

In [4]:
# Create dataframe that summarizes image classification in each subset
# Create a spreadsheet-style pivot table as a DataFrame.
df = pd.pivot_table(metadata, index='subset', columns='label', values='filename', aggfunc='count')

# Add new column with total number of images in each subset
df['total'] = df['visible_damage'] + df['no_damage']

# Show dataframe
df

label,no_damage,visible_damage,total
subset,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
test,80,80,160
train,198,198,396
validation,36,36,72


## 5. Deprem öncesi ve afet sonrası görüntülerin karşılaştırılması

Burada depremden önce ve sonra farklı görüntüler çiziyoruz ve farklı görüntü eşitlerine bakmak için widget'ı kullanarak etkilenen binaların nasıl göründüğünü kontrol ediyoruz. `Image Num` parametresi no_damage training dizinindeki her görüntünün dizin numarasına karşılık gelir.

In [5]:
dataset = 'train'
# Match images in the no damage and damage dataset based on the location coordinates in the file name
matches = list(set(metadata.query(f'subset == "{dataset}" & label == "visible_damage"')['filename'])
               .intersection(metadata.query(f'subset == "{dataset}" & label == "no_damage"')['filename']))

# Load index slider to navigate between the paired images
file_index_widget = widgets.IntSlider(min=0, max=len(matches)-1, value=10, description='Image Num')

# Load visualizer to match paired images
interact(utils.interactive_plot_pair(f'../../data/{dataset}/', matches), file_index=file_index_widget);

TraitError: setting min > max