In [3]:
import re
import pandas as pd

def read_numbers_from_file(filename):
    """
    Lit tous les nombres d'un fichier texte.

    Args:
        filename (str): Chemin vers le fichier texte.

    Returns:
        list of float: Liste de nombres extraits du fichier.
    """
    with open(filename, 'r') as file:
        content = file.read()
    
    # Expression régulière pour extraire les nombres, y compris la notation scientifique
    numbers = re.findall(r'[-+]?\d*\.\d+e[+-]?\d+|[-+]?\d+\.?\d*', content)
    
    # Convertir les chaînes en float
    numbers = [float(num) for num in numbers]
    return numbers

def split_into_series(numbers, series_length=501):
    """
    Divise une liste de nombres en sous-listes de longueur spécifiée.

    Args:
        numbers (list of float): Liste de nombres à diviser.
        series_length (int): Nombre de valeurs par série.

    Returns:
        list of list of float: Liste de séries.
    """
    if len(numbers) % series_length != 0:
        print(f"Avertissement : le nombre total de valeurs ({len(numbers)}) n'est pas un multiple de {series_length}. Les valeurs restantes seront ignorées.")
    
    num_series = len(numbers) // series_length
    series = [numbers[i*series_length : (i+1)*series_length] for i in range(num_series)]
    return series

def create_dataframe(series_list):
    """
    Crée un DataFrame pandas à partir d'une liste de séries.

    Args:
        series_list (list of list of float): Liste de séries de nombres.

    Returns:
        pandas.DataFrame: DataFrame avec chaque série comme colonne.
    """
    # Transposer la liste pour avoir chaque série comme une colonne
    df = pd.DataFrame(series_list).transpose()
    
    # Renommer les colonnes
    df.columns = [f'Série_{i+1}' for i in range(df.shape[1])]
    return df

def main():
    input_filename = 'FordB_TEST.txt'    # Nom du fichier d'entrée
    output_filename = 'output.csv' # Nom du fichier de sortie

    # Lire les nombres depuis le fichier
    numbers = read_numbers_from_file(input_filename)
    print(f"Nombre total de valeurs lues : {len(numbers)}")

    # Diviser les nombres en séries de 501 valeurs
    series_list = split_into_series(numbers, series_length=501)
    print(f"Nombre de séries trouvées : {len(series_list)}")

    # Créer le DataFrame
    df = create_dataframe(series_list)
    print(f"DataFrame créé avec {df.shape[0]} lignes et {df.shape[1]} colonnes.")

    # Sauvegarder le DataFrame en CSV
    df.to_csv(output_filename, index=False)
    print(f"Les données ont été enregistrées dans {output_filename}")

if __name__ == "__main__":
    main()


Nombre total de valeurs lues : 405810
Nombre de séries trouvées : 810
DataFrame créé avec 501 lignes et 810 colonnes.
Les données ont été enregistrées dans output.csv


In [4]:
def supprimer_premiere_ligne(input_csv, output_csv):
    """
    Supprime la première ligne d'un fichier CSV.

    Args:
        input_csv (str): Chemin vers le fichier CSV d'entrée.
        output_csv (str): Chemin vers le fichier CSV de sortie.
    """
    with open(input_csv, 'r', encoding='utf-8') as fichier_entree:
        lignes = fichier_entree.readlines()
    
    if len(lignes) < 2:
        print("Le fichier CSV ne contient pas assez de lignes pour supprimer la première ligne.")
        return
    
    # Supprimer la première ligne
    lignes_sans_premiere = lignes[2:]
    
    with open(output_csv, 'w', encoding='utf-8') as fichier_sortie:
        fichier_sortie.writelines(lignes_sans_premiere)
    
    print(f"La première ligne a été supprimée. Le fichier modifié est enregistré sous '{output_csv}'.")

def main():
    input_csv = 'FordB_TRAIN_cleared.csv'    # Nom du fichier d'entrée
    output_csv = 'FordB_TRAIN_cleared.csv' # Nom du fichier de sortie
    
    supprimer_premiere_ligne(input_csv, output_csv)

if __name__ == "__main__":
    main()


La première ligne a été supprimée. Le fichier modifié est enregistré sous 'FordB_TRAIN_cleared.csv'.
