In [3]:
! pip install ruptures

Collecting ruptures
  Downloading ruptures-1.1.9-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.2/1.2 MB[0m [31m18.9 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: ruptures
Successfully installed ruptures-1.1.9


In [30]:
import numpy as np
import ruptures as rpt

def detect_change_points(data, model="l2", pen=10):
    """
    Detect change points in the data using the specified model and penalty.

    Parameters:
    data (list or np.array): Input data.
    model (str): Model used for change point detection (default is "l2").
    pen (int or float): Penalty value for the change point detection (default is 10).

    Returns:
    list: Indices of change points.
    """
    algo = rpt.Pelt(model=model).fit(data)
    change_points = algo.predict(pen=pen)
    return change_points

def merge_segments(data, change_points, method="min"):
    """
    Merge values within each segment defined by change points.

    Parameters:
    data (list or np.array): Input data.
    change_points (list): Indices of change points.
    method (str): Method to merge values ("min" or "max").

    Returns:
    list: Data with merged values.
    """
    merged_data = []
    start_idx = 0

    for end_idx in change_points:
        segment = data[start_idx:end_idx]
        if method == "min":
            merged_value = min(segment)
        elif method == "max":
            merged_value = max(segment)
        else:
            raise ValueError("Method should be 'min' or 'max'")

        merged_data.extend([merged_value] * len(segment))
        start_idx = end_idx

    return merged_data

# Exemple d'utilisation
data = [444.0, 211.0, 80.0, 1.0, 0.0, 10.0, 124.0, 125.0, 6.0, 121.0, 126.0, 129.0, 130.0, 131.0, 132.0, 8.0, 7.0, 122.0, 123.0, 127.0, 128.0, 135.0, 153.0, 133.0, 134.0, 143.0, 136.0, 137.0, 138.0, 139.0, 142.0, 148.0, 149.0, 140.0, 141.0, 144.0, 145.0, 146.0, 147.0] #[7, 1, 0, 140, 124, 131, 127]
data_np = np.array(data)

# Détecter les points de changement
change_points = detect_change_points(data_np, pen=3)
print("Change points:", change_points)

# Fusionner les segments en prenant la plus petite valeur
merged_data_min = merge_segments(data, change_points, method="min")
print("Data with merged values (min):", merged_data_min)

# Fusionner les segments en prenant la plus grande valeur
merged_data_max = merge_segments(data, change_points, method="max")
print("Data with merged values (max):", merged_data_max)


Change points: [5, 10, 15, 20, 25, 30, 35, 39]
Data with merged values (min): [0.0, 0.0, 0.0, 0.0, 0.0, 6.0, 6.0, 6.0, 6.0, 6.0, 126.0, 126.0, 126.0, 126.0, 126.0, 7.0, 7.0, 7.0, 7.0, 7.0, 128.0, 128.0, 128.0, 128.0, 128.0, 136.0, 136.0, 136.0, 136.0, 136.0, 140.0, 140.0, 140.0, 140.0, 140.0, 144.0, 144.0, 144.0, 144.0]
Data with merged values (max): [444.0, 444.0, 444.0, 444.0, 444.0, 125.0, 125.0, 125.0, 125.0, 125.0, 132.0, 132.0, 132.0, 132.0, 132.0, 127.0, 127.0, 127.0, 127.0, 127.0, 153.0, 153.0, 153.0, 153.0, 153.0, 143.0, 143.0, 143.0, 143.0, 143.0, 149.0, 149.0, 149.0, 149.0, 149.0, 147.0, 147.0, 147.0, 147.0]


In [31]:
def regrouper_valeurs_min(data, seuil=1):
    """
    Regroupe les valeurs similaires en prenant la plus petite valeur.

    Parameters:
    data (list): Liste des valeurs à traiter.
    seuil (int): Différence maximale pour considérer les valeurs comme similaires.

    Returns:
    list: Liste avec les valeurs regroupées.
    """
    data = sorted(data)
    result = []
    groupe = [data[0]]

    for i in range(1, len(data)):
        if data[i] - groupe[-1] <= seuil:
            groupe.append(data[i])
        else:
            result.append(min(groupe))
            groupe = [data[i]]

    if groupe:
        result.append(min(groupe))

    return result

def regrouper_valeurs_max(data, seuil=1):
    """
    Regroupe les valeurs similaires en prenant la plus grande valeur.

    Parameters:
    data (list): Liste des valeurs à traiter.
    seuil (int): Différence maximale pour considérer les valeurs comme similaires.

    Returns:
    list: Liste avec les valeurs regroupées.
    """
    data = sorted(data)
    result = []
    groupe = [data[0]]

    for i in range(1, len(data)):
        if data[i] - groupe[-1] <= seuil:
            groupe.append(data[i])
        else:
            result.append(max(groupe))
            groupe = [data[i]]

    if groupe:
        result.append(max(groupe))

    return result

# Exemple d'utilisation
seuil = 0.5 * (max(data) - min(data))

print("Regrouper en la plus petite valeur:", regrouper_valeurs_min(data, seuil))
print("Regrouper en la plus grande valeur:", regrouper_valeurs_max(data, seuil))


Regrouper en la plus petite valeur: [0.0, 444.0]
Regrouper en la plus grande valeur: [211.0, 444.0]


In [32]:
import numpy as np


array = [1, 2, 7, 11, 5, 0, 1000000, 50000]
np.mean(array)

131253.25

In [33]:
np.median(array)

6.0

In [34]:
def regrouper_valeurs_min(data, seuil=1):
    """
    Regroupe les valeurs similaires en prenant la plus petite valeur.

    Parameters:
    data (list): Liste des valeurs à traiter.
    seuil (int): Différence maximale pour considérer les valeurs comme similaires.

    Returns:
    list: Liste avec les valeurs regroupées.
    """
    data = sorted(data)
    result = []
    groupe = [data[0]]

    for i in range(1, len(data)):
        if data[i] - groupe[-1] <= seuil:
            groupe.append(data[i])
        else:
            result.append(min(groupe))
            groupe = [data[i]]

    if groupe:
        result.append(min(groupe))

    return result

def regrouper_valeurs_max(data, seuil=1):
    """
    Regroupe les valeurs similaires en prenant la plus grande valeur.

    Parameters:
    data (list): Liste des valeurs à traiter.
    seuil (int): Différence maximale pour considérer les valeurs comme similaires.

    Returns:
    list: Liste avec les valeurs regroupées.
    """
    data = sorted(data)
    result = []
    groupe = [data[0]]

    for i in range(1, len(data)):
        if data[i] - groupe[-1] <= seuil:
            groupe.append(data[i])
        else:
            result.append(max(groupe))
            groupe = [data[i]]

    if groupe:
        result.append(max(groupe))

    return result

# Exemple d'utilisation
seuil = 0.5 * (np.median(data) - np.min(data))

print("Regrouper en la plus petite valeur:", regrouper_valeurs_min(data, seuil))
#print("Regrouper en la plus grande valeur:", regrouper_valeurs_max(array, seuil))

Regrouper en la plus petite valeur: [0.0, 80.0, 444.0]
