In [1]:
import pandas as pd

# Load the CSV
df = pd.read_csv('Donnees_Vols_RA.csv')  # use your actual filename if different
df['is_attack'] = 0
# List of columns to keep
columns_to_keep = [
    'mission_id', 'time', 'real_x', 'real_y', 'real_z',
    'vx', 'vy', 'vz', 'ax', 'ay', 'az',
    'roll', 'pitch', 'yaw',
    'wind_x', 'wind_y', 'wind_z',
    'erreur_m', 'velocity',
    'rain', 'fog','snow' ,'is_attack'      

]

# Filter the DataFrame
filtered_df = df[columns_to_keep]

# Save the result
filtered_df.to_csv('donnees_nettoyee_R.csv', index=False)

print(" Saved cleaned CSV with selected columns to 'donnees_nettoyee.csv'")

 Saved cleaned CSV with selected columns to 'donnees_nettoyee.csv'


In [2]:
import pandas as pd

# Load the CSV file
df = pd.read_csv('donnees_nettoyee_R.csv')

# Final list of valid flight rows
output_rows = []

# Track current block of rows
current_block = []
current_id = None

# Counter for assigning new clean mission_ids
new_flight_id = 1

# Go through rows one by one
for _, row in df.iterrows():
    row_id = row['mission_id']

    if current_id is None:
        current_id = row_id
        current_block.append(row)
    elif row_id == current_id:
        current_block.append(row)
    else:
        # ID changed, time to process the current block
        if len(current_block) == 21:
            for r in current_block:
                r['mission_id'] = new_flight_id
                output_rows.append(r)
            new_flight_id += 1

        # Start a new block
        current_block = [row]
        current_id = row_id

# Handle the last block
if len(current_block) == 21:
    for r in current_block:
        r['mission_id'] = new_flight_id
        output_rows.append(r)

# Convert to DataFrame
output_df = pd.DataFrame(output_rows)

# Save to CSV
output_df.to_csv('donnees_vol_multiple_filtered_R.csv', index=False)

print("✅ Saved cleaned flight data with new mission IDs to 'cleaned_flight_data.csv'")

✅ Saved cleaned flight data with new mission IDs to 'cleaned_flight_data.csv'


In [3]:
import pandas as pd

# Charger les données
df = pd.read_csv("donnees_vol_multiple_filtered_R.csv")

# Convertir 'erreur_m' en numérique (ignore les erreurs de conversion)
df["erreur_m"] = pd.to_numeric(df["erreur_m"], errors="coerce")

# Liste des vols valides
vols_valides = []

# Vérification des conditions sur chaque vol
for mission_id, groupe in df.groupby("mission_id"):
    groupe_sorted = groupe.sort_values("time")
    premiers_wp = groupe_sorted.head(7)

    # Vérifier les deux conditions
    condition_erreur_7points = (premiers_wp["erreur_m"] > 8).any()
    moyenne_vol = groupe_sorted["erreur_m"].mean()
    condition_moyenne = moyenne_vol >= 18

    # Appliquer le OU : on supprime le vol si l'une des deux conditions est vraie
    if condition_erreur_7points or condition_moyenne:
        continue

    # Sinon, garder ce vol
    vols_valides.append(mission_id)

# Filtrer le DataFrame avec les vols valides
df_final = df[df["mission_id"].isin(vols_valides)]

# Sauvegarder dans un nouveau fichier CSV
df_final.to_csv("donnees_vols_valides_R.csv", index=False)

# Affichage de la moyenne d'erreur et du nombre de vols gardés
moyenne_finale = df_final["erreur_m"].mean()
print(f"Moyenne finale des erreurs : {moyenne_finale:.2f} mètres")
print(f"Nombre de vols restants : {len(vols_valides)}")
print("Fichier 'donnees_vols_valides_R.csv' enregistré avec succès.")


Moyenne finale des erreurs : 4.82 mètres
Nombre de vols restants : 269
Fichier 'donnees_vols_valides_R.csv' enregistré avec succès.


In [4]:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np

def main():
    # 1. Charger les données
    df = pd.read_csv('donnees_vols_valides_R.csv')

    # 2. Calcul de la matrice de corrélation
    corr = df.corr()
    print("Matrice de corrélation :")
    print(corr)
    print("\n" + "="*80 + "\n")

    # 3. Extraction des paires de variables (sans doublons ni diagonale)
    mask = np.triu(np.ones(corr.shape), k=1).astype(bool)
    corr_pairs = (
        corr.where(mask)
            .stack()
            .reset_index()
            .rename(columns={'level_0': 'Variable1', 'level_1': 'Variable2', 0: 'Corrélation'})
    )

    # 4. Filtrage des paires avec corrélation >= 0.7 en valeur absolue
    high_corr = corr_pairs[corr_pairs['Corrélation'].abs() >= 0.7] \
        .sort_values(by='Corrélation', ascending=False)

    # 5. Affichage des paires à forte corrélation
    print("Paires de variables avec |corrélation| ≥ 0.7 :")
    for _, row in high_corr.iterrows():
        v1, v2, r = row['Variable1'], row['Variable2'], row['Corrélation']
        print(f"  - {v1} ↔ {v2} : corrélation = {r:.3f}")

if __name__ == "__main__":
    main()


Matrice de corrélation :
            mission_id      time    real_x    real_y    real_z        vx  \
mission_id    1.000000  0.251616  0.048896 -0.054207 -0.083339 -0.046181   
time          0.251616  1.000000  0.086511 -0.136874 -0.257168  0.000591   
real_x        0.048896  0.086511  1.000000 -0.462159 -0.083758  0.562741   
real_y       -0.054207 -0.136874 -0.462159  1.000000  0.194721 -0.053077   
real_z       -0.083339 -0.257168 -0.083758  0.194721  1.000000 -0.013701   
vx           -0.046181  0.000591  0.562741 -0.053077 -0.013701  1.000000   
vy           -0.049511 -0.242121 -0.160222  0.463822  0.184094 -0.309608   
vz            0.141477  0.112288  0.351218 -0.090374  0.446097  0.225006   
ax           -0.053219 -0.035775  0.305439  0.188453 -0.096223  0.618995   
ay            0.246871  0.992677  0.072203 -0.125778 -0.248041 -0.016472   
az           -0.256502 -0.992848 -0.085541  0.134064  0.258352  0.005743   
roll         -0.072855 -0.047171 -0.004148  0.006705  0.009926 

In [5]:
import pandas as pd

# Charger le fichier
df = pd.read_csv("donnees_vol_multiple_filtered_R.csv")

# Réinitialiser l'index
df = df.reset_index(drop=True)

# Garder la valeur is_attack originale par mission_id
is_attack_values = df.groupby('mission_id')['is_attack'].first().reset_index()

# Ajouter un compteur par mission_id (position du waypoint)
df['ligne_id'] = df.groupby('mission_id').cumcount()

# Passer de long à wide : chaque ligne devient un vol à plat
df_flat = df.pivot(index='mission_id', columns='ligne_id')

# Aplatir les colonnes multi-niveaux
df_flat.columns = [f"{col}_{i}" for col, i in df_flat.columns]

# Réinitialiser l'index pour fusionner
df_flat = df_flat.reset_index()

# Fusionner avec les valeurs originales de is_attack
df_flat = pd.merge(df_flat, is_attack_values, on='mission_id', how='left')

# Supprimer toutes les colonnes is_attack_X qui ont été créées par le pivot
cols_to_drop = [col for col in df_flat.columns if col.startswith('is_attack_')]
df_flat = df_flat.drop(columns=cols_to_drop)

# Sauvegarder le fichier aplati
df_flat.to_csv("vols_aplatis_R.csv", index=False)

print("✅ Vols aplatis avec succès ! (avec un seul is_attack par vol)")

✅ Vols aplatis avec succès ! (avec un seul is_attack par vol)
