# Criar diversos ficheiros excel que permitam os diversos testes e treinos

In [1]:
import os
import pandas as pd

---

## FLAME: Tudo (Training + Test -> Misturados)

Este código criar um ficheiro excel com 4 colunas:
- `path`: Tem o caminho para a imagem
- `label_cat`: Guarda uma label categórica (Fire e No_Fire)
- `label_bi`: Guarda uma label binária (1: Fogo, 0: Não Fogo)
- `split`: Indica se veio do folder Training ou do folder Test

Este excel vai ter os dados todos misturados, ou seja full shuffle.

In [2]:
# Caminho para a pasta FLAME no WSL
base_dir = os.path.expanduser('~/Estagio/Datasets/FLAME')

# Lista para armazenar os dados
data = []

# Percorre os diretórios
for split in ['Training', 'Test']:
    for category in ['Fire', 'No_Fire']:
        folder_path = os.path.join(base_dir, split, category)
        if not os.path.exists(folder_path):
            continue
        for filename in os.listdir(folder_path):
            if filename.lower().endswith(('.jpg', '.jpeg', '.png')):
                file_path = os.path.join(folder_path, filename)
                label_cat = category
                label_bi = 1 if category == 'Fire' else 0
                data.append({
                    'image_path': file_path,
                    'label_cat': label_cat,
                    'label_bi': label_bi,
                    'split': split
                })

# Cria o DataFrame
df = pd.DataFrame(data)

# Embaralha as linhas
df = df.sample(frac=1).reset_index(drop=True)

# Salva como CSV
df.to_csv('FLAME.csv', index=False)

## FLAME: Só o folder de Treino

Para criar este dataset vamos usar o csv 'FLAME_train.csv'.

Este código criar um ficheiro excel com 4 colunas:
- `path`: Tem o caminho para a imagem
- `label_cat`: Guarda uma label categórica (Fire e No_Fire)
- `label_bi`: Guarda uma label binária (1: Fogo, 0: Não Fogo)
- `split`: Indica se veio do folder Training ou do folder Test

Este excel vai ter os dados todos misturados, ou seja full shuffle.

In [4]:
# Caminho para a pasta FLAME no WSL
base_dir = os.path.expanduser('~/Estagio/Datasets/FLAME')

# Lista para armazenar os dados
data = []

# Somente para 'Training'
split = 'Training'
for category in ['Fire', 'No_Fire']:
    folder_path = os.path.join(base_dir, split, category)
    if not os.path.exists(folder_path):
        continue
    for filename in os.listdir(folder_path):
        if filename.lower().endswith(('.jpg', '.jpeg', '.png')):
            file_path = os.path.join(folder_path, filename)
            label_cat = category
            label_bi = 1 if category == 'Fire' else 0
            data.append({
                'image_path': file_path,
                'label_cat': label_cat,
                'label_bi': label_bi,
                'split': split
            })

# Cria o DataFrame
df_training = pd.DataFrame(data)

# Embaralha as linhas
df_training = df_training.sample(frac=1).reset_index(drop=True)

# Salva como CSV
df_training.to_csv('FLAME_train.csv', index=False)

## FLAME: Só o folder de Teste

Para criar este dataset vamos usar o csv 'FLAME_test.csv'.

Este código criar um ficheiro excel com 4 colunas:
- `path`: Tem o caminho para a imagem
- `label_cat`: Guarda uma label categórica (Fire e No_Fire)
- `label_bi`: Guarda uma label binária (1: Fogo, 0: Não Fogo)
- `split`: Indica se veio do folder Training ou do folder Test

Este excel vai ter os dados todos misturados, ou seja full shuffle.

In [5]:
# Caminho para a pasta FLAME no WSL
base_dir = os.path.expanduser('~/Estagio/Datasets/FLAME')

# Lista para armazenar os dados
data = []

# Somente para 'Training'
split = 'Test'
for category in ['Fire', 'No_Fire']:
    folder_path = os.path.join(base_dir, split, category)
    if not os.path.exists(folder_path):
        continue
    for filename in os.listdir(folder_path):
        if filename.lower().endswith(('.jpg', '.jpeg', '.png')):
            file_path = os.path.join(folder_path, filename)
            label_cat = category
            label_bi = 1 if category == 'Fire' else 0
            data.append({
                'image_path': file_path,
                'label_cat': label_cat,
                'label_bi': label_bi,
                'split': split
            })

# Cria o DataFrame
df_training = pd.DataFrame(data)

# Embaralha as linhas
df_training = df_training.sample(frac=1).reset_index(drop=True)

# Salva como CSV
df_training.to_csv('FLAME_test.csv', index=False)

## FLAME: Recriar estudo 2

Para criar este dataset vamos usar o csv 'FLAME.csv' e tal como diz o estudo selecionar aleatóriamente 5615 imagens, tal que 2,854 são Fogo e 2,761 são Não Fogo.

Este código criar um ficheiro excel com 4 colunas:
- `path`: Tem o caminho para a imagem
- `label_cat`: Guarda uma label categórica (Fire e No_Fire)
- `label_bi`: Guarda uma label binária (1: Fogo, 0: Não Fogo)
- `split`: Indica se veio do folder Training ou do folder Test

Este excel vai ter os dados todos misturados, ou seja full shuffle.

In [3]:
# Carrega o CSV original
df = pd.read_csv('FLAME.csv')

# Seleciona 2854 imagens de fogo
fire_samples = df[df['label_cat'] == 'Fire'].sample(n=2854, random_state=42)

# Seleciona 2761 imagens de não-fogo
no_fire_samples = df[df['label_cat'] == 'No_Fire'].sample(n=2761, random_state=42)

# Junta e embaralha os dados
df_selected = pd.concat([fire_samples, no_fire_samples]).sample(frac=1, random_state=42).reset_index(drop=True)

# Salva em novo CSV
df_selected.to_csv('Estudo2_Recriado.csv', index=False)

# Mostra a contagem de cada classe e origem
print("Contagem por categoria (label_cat):")
print(df_selected['label_cat'].value_counts())

print("\nContagem por origem (split):")
print(df_selected['split'].value_counts())

Contagem por categoria (label_cat):
Fire       2854
No_Fire    2761
Name: label_cat, dtype: int64

Contagem por origem (split):
Training    4585
Test        1030
Name: split, dtype: int64


---

## UAVS Raw images 

Para criar este dataset vamos usar o csv 'UAVS_RawImages.csv'.

Este código criar um ficheiro excel com 4 colunas:
- `image_path`: Tem o caminho para a imagem
- `annot_path`: Caminho para as anotações da imagem
- `label_cat`: Guarda uma label categórica (Fire e No_Fire)
- `label_bi`: Guarda uma label binária (1: Fogo, 0: Não Fogo)
- `split`: Indica se veio do folder Training ou do folder Test

Este excel vai ter os dados todos misturados, ou seja full shuffle.

In [3]:
base_dir = os.path.expanduser('~/Estagio/Datasets/UAVS-FFDB')
img_root = os.path.join(base_dir, 'Original Image Dataset (Raw Images)')
annot_root = os.path.join(base_dir, 'Annotation Files', 'Raw image annotation')

data = []

# Mapeamento entre subpastas e suas anotações
folder_pairs = {
    'Evening Fire Incident_raw_img': 'Evening fire incident_raw_annot',
    'Pre-Evening Fire Incident_raw_img': 'Pre-evening fire incident_raw_annot',
    'Evening Forest condition_raw_img': 'Evening fire incident_raw_annot',  # sem anotação correspondente
    'Pre-evening Forest condition_raw_img': 'Pre-evening fire incident_raw_annot'  # sem anotação correspondente
}

for img_folder, annot_folder in folder_pairs.items():
    img_path = os.path.join(img_root, img_folder)
    annot_path = os.path.join(annot_root, annot_folder)

    for filename in os.listdir(img_path):
        if filename.lower().endswith('.png'):
            image_full_path = os.path.join(img_path, filename)

            # Procurar anotação com mesmo nome, mas extensão .xml
            annot_file = os.path.splitext(filename)[0] + '.xml'
            annot_full_path = os.path.join(annot_path, annot_file)
            if os.path.exists(annot_full_path):
                annotation = annot_full_path
            else:
                annotation = None

            label = 'Fire' if 'fire' in img_folder.lower() else 'No_Fire'
            label_bi = 1 if label == 'Fire' else 0

            data.append({
                'image_path': image_full_path,
                'annot_path': annotation,
                'split': img_folder,
                'label_cat': label,
                'label_bi': label_bi
            })

df_raw = pd.DataFrame(data)
df_raw = df_raw.sample(frac=1).reset_index(drop=True)
df_raw.to_csv('UAVS_RawImages.csv', index=False)

## UAVS AUGMENTED images 

Para criar este dataset vamos usar o csv 'UAVS_RawImages.csv'.

Este código criar um ficheiro excel com 4 colunas:
- `image_path`: Tem o caminho para a imagem
- `label_cat`: Guarda uma label categórica (Fire e No_Fire)
- `label_bi`: Guarda uma label binária (1: Fogo, 0: Não Fogo)
- `split`: Indica se veio do folder Training ou do folder Test

Este excel vai ter os dados todos misturados, ou seja full shuffle.

In [5]:
data_aug = []

base_dir = os.path.expanduser('~/Estagio/Datasets/UAVS-FFDB')
aug_root = os.path.join(base_dir, 'Augmented Images')

for folder in os.listdir(aug_root):
    folder_path = os.path.join(aug_root, folder)
    if not os.path.isdir(folder_path):
        continue

    for filename in os.listdir(folder_path):
        if filename.lower().endswith('.png'):
            image_full_path = os.path.join(folder_path, filename)

            label = 'Fire' if 'fire' in folder.lower() else 'No_Fire'
            label_bi = 1 if label == 'Fire' else 0

            data_aug.append({
                'image_path': image_full_path,
                'split': folder,
                'label_cat': label,
                'label_bi': label_bi
            })

df_aug = pd.DataFrame(data_aug)
df_raw = df_raw.sample(frac=1).reset_index(drop=True)
df_aug.to_csv('UAVS_AugmentedImages.csv', index=False)

## FireMan: Train

In [2]:
# Caminho para a pasta FLAME no WSL
base_dir = os.path.expanduser('~/Estagio/Datasets/FireMan')

# Lista para armazenar os dados
data = []

# Somente para 'Training'
split = 'train'
for category in ['Fire', 'No_Fire']:
    folder_path = os.path.join(base_dir, split, category)
    if not os.path.exists(folder_path):
        continue
    for filename in os.listdir(folder_path):
        if filename.lower().endswith(('.jpg', '.jpeg', '.png')):
            file_path = os.path.join(folder_path, filename)
            label_cat = category
            label_bi = 1 if category == 'Fire' else 0
            data.append({
                'image_path': file_path,
                'label_cat': label_cat,
                'label_bi': label_bi,
                'split': split
            })

# Cria o DataFrame
df_training = pd.DataFrame(data)

# Embaralha as linhas
df_training = df_training.sample(frac=1).reset_index(drop=True)

# Salva como CSV
df_training.to_csv('FireMan_train.csv', index=False)

## FireMan: Val

In [3]:
# Caminho para a pasta FLAME no WSL
base_dir = os.path.expanduser('~/Estagio/Datasets/FireMan')

# Lista para armazenar os dados
data = []

# Somente para 'Training'
split = 'val'
for category in ['Fire', 'No_Fire']:
    folder_path = os.path.join(base_dir, split, category)
    if not os.path.exists(folder_path):
        continue
    for filename in os.listdir(folder_path):
        if filename.lower().endswith(('.jpg', '.jpeg', '.png')):
            file_path = os.path.join(folder_path, filename)
            label_cat = category
            label_bi = 1 if category == 'Fire' else 0
            data.append({
                'image_path': file_path,
                'label_cat': label_cat,
                'label_bi': label_bi,
                'split': split
            })

# Cria o DataFrame
df_training = pd.DataFrame(data)

# Embaralha as linhas
df_training = df_training.sample(frac=1).reset_index(drop=True)

# Salva como CSV
df_training.to_csv('FireMan_val.csv', index=False)

## FireMan: Test

In [4]:
# Caminho para a pasta FLAME no WSL
base_dir = os.path.expanduser('~/Estagio/Datasets/FireMan')

# Lista para armazenar os dados
data = []

# Somente para 'Training'
split = 'test'
for category in ['Fire', 'No_Fire']:
    folder_path = os.path.join(base_dir, split, category)
    if not os.path.exists(folder_path):
        continue
    for filename in os.listdir(folder_path):
        if filename.lower().endswith(('.jpg', '.jpeg', '.png')):
            file_path = os.path.join(folder_path, filename)
            label_cat = category
            label_bi = 1 if category == 'Fire' else 0
            data.append({
                'image_path': file_path,
                'label_cat': label_cat,
                'label_bi': label_bi,
                'split': split
            })

# Cria o DataFrame
df_training = pd.DataFrame(data)

# Embaralha as linhas
df_training = df_training.sample(frac=1).reset_index(drop=True)

# Salva como CSV
df_training.to_csv('FireMan_test.csv', index=False)