In [1]:
from typing import Optional
from tabulate import tabulate
import yaml

class FeatureCatalog:
    with open("../../data/features.yml", 'r') as file:
        data = yaml.safe_load(file)

    @classmethod
    def _parse_dict(cls, data, key):
        if key in data:
            return data[key]
        else:
            return ""

    @classmethod
    def _parse_list(cls, data):
        return [item for item in data if item not in ["", " ", None]]

    @classmethod
    def _print_table(cls, data):
        print(tabulate(data, headers=data.keys(), tablefmt="rounded_grid", maxcolwidths=40))

    @classmethod
    def _format_parameters(cls, data):
        if "parameters" in data:
            formatted_parameters = []
            for parameter in data["parameters"]:
                name = cls._parse_dict(parameter, "name")
                description = cls._parse_dict(parameter, "description")
                formatted_parameters.append(f"{name}: {description}")

            return "\n".join(formatted_parameters)
        else:
            return ""

    @classmethod
    def show_tags(cls) -> None:
        tags = {"Name": [], "Description": []}
        for tag in cls.data["tags"]:
            tags["Name"].append(cls._parse_dict(tag, "name"))
            tags["Description"].append(cls._parse_dict(tag, "description"))
            
        cls._print_table(tags)

    @classmethod
    def show_features(cls, tag_name: Optional[str] = None) -> None:
        features = {"Name": [], "Tags": [], "Description": [], "Details": [], "When": [], "Parameters": []}
        for feature in cls.data["features"]:
            tags = cls._parse_list(feature["tags"])
            if tag_name is None or tag_name in tags:
                features["Name"].append(cls._parse_dict(feature, "name"))
                features["Tags"].append("\n".join(tags))
                features["Description"].append(cls._parse_dict(feature, "description"))
                features["Details"].append(cls._parse_dict(feature, "details"))
                features["When"].append(cls._parse_dict(feature, "when"))
                features["Parameters"].append(cls._format_parameters(feature))

        cls._print_table(features)

    @classmethod
    def show_feature(cls, feature_name: str) -> None:
        table = []
        for feature in cls.data["features"]:
            name = cls._parse_dict(feature, "name")
            if name.startswith(feature_name):
                table.append(["Name", name])
                table.append(["Tags", "\n".join(cls._parse_list(feature["tags"]))])
                table.append(["Description", cls._parse_dict(feature, "description")])
                table.append(["Details", cls._parse_dict(feature, "details")])
                table.append(["When", cls._parse_dict(feature, "when")])
                table.append(["Parameters", cls._format_parameters(feature)])

        print(tabulate(table, tablefmt="plain"))

def catalog(tag: Optional[str] = None, feature: Optional[str] = None):
    if tag is None and feature is None:
        FeatureCatalog.show_tags()
    elif tag is None:
        FeatureCatalog.show_feature(feature_name=feature)
    else:
        FeatureCatalog.show_features(tag_name=tag)

In [2]:
catalog()

╭──────────────────────────────┬───────────────╮
│ Name                         │ Description   │
├──────────────────────────────┼───────────────┤
│ rilevamento pattern          │               │
├──────────────────────────────┼───────────────┤
│ ridondanza della serie       │               │
├──────────────────────────────┼───────────────┤
│ regolarità delle time series │               │
├──────────────────────────────┼───────────────┤
│ conteggio                    │               │
├──────────────────────────────┼───────────────┤
│ statistica medie             │               │
├──────────────────────────────┼───────────────┤
│ statistica di base           │               │
├──────────────────────────────┼───────────────┤
│ trend                        │               │
╰──────────────────────────────┴───────────────╯


In [3]:
catalog(tag="trend")

╭───────────────────────────────────┬────────┬──────────────────────────────────────────┬──────────────────────────────────────────┬──────────────────────────────────────────┬──────────────────────────────────────────╮
│ Name                              │ Tags   │ Description                              │ Details                                  │ When                                     │ Parameters                               │
├───────────────────────────────────┼────────┼──────────────────────────────────────────┼──────────────────────────────────────────┼──────────────────────────────────────────┼──────────────────────────────────────────┤
│ agg_linear_trend(x, param):       │ trend  │ Calcola una regressione lineare dei      │ È possibile specificare l'attributo da   │ Utilizzabile per scoprire se la serie    │ attr: rappresenta l'attributo da         │
│                                   │        │ valori della serie temporale che sono    │ estrarre dalla regressione lineare

In [4]:
catalog(feature="linear_trend")

Name         linear_trend(x, param)
Tags         trend
Description  Calcola una regressione lineare per i valori della serie temporale rispetto alla sequenza da 0 a lunghezza della serie temporale meno uno.
Details      È possibile specificare l'attributo da estrarre dalla regressione lineare, come ad esempio "pvalue", "rvalue", "intercept", "slope" o "stderr".
When         Utilizzabile per scoprire se la serie segue un trend lineare
Parameters   attr: rappresenta l'attributo da estrarre dalla regressione lineare ("pvalue", "rvalue", "intercept", "slope", "stderr").
             chunk_len: specifica quanti valori della serie temporale sono presenti in ciascun chunk.
             f_agg: specifica la funzione di aggregazione da utilizzare per aggregare i valori all'interno di ciascun chunk ("max", "min", "mean", "median").


In [9]:
features_list = [feature["name"].split("(")[0] for feature in FeatureCatalog.data["features"]]
features_list

['count_above',
 'count_above_mean',
 'count_below',
 'count_below_mean',
 'range_count',
 'number_peaks',
 'number_crossing_m',
 'value_count',
 'sum_values',
 'absolute_maximum',
 'length',
 'first_location_of_maximum',
 'last_location_of_maximum',
 'first_location_of_minimum',
 'last_location_of_minimum',
 'mean',
 'median',
 'minimum',
 'quantile',
 'root_mean_square',
 'standard_deviation',
 'variance',
 'ratio_value_number_to_time_series_length',
 'sum_of_reoccurring_values',
 'percentage_of_reoccurring_datapoints_to_all_datapoints',
 'has_duplicate',
 'has_duplicate_max',
 'symmetry_looking',
 'variance_larger_than_standard_deviation',
 'skewness',
 'abs_energy',
 'mean_second_derivative_central',
 'fft_coefficient',
 'ar_coefficient',
 'partial_autocorrelation',
 'permutation_entropy',
 'spkt_welch_density',
 'time_reversal_asymmetry_statistic',
 'cwt_coefficients',
 'autocorrelation',
 'agg_autocorrelation',
 'matrix_profile',
 'sample_entropy',
 'c3',
 'large_standard_deviati