# AsaPy

### Asa Analysis

#### Analysis.pareto_front

    """
    Identifies the Pareto front of a DataFrame based on objectives to minimize and maximize.

    Args:
        df (pd.DataFrame): Input DataFrame containing the data.
        list_min (list of str, optional): List of variable names to minimize. Defaults to None.
        list_max (list of str, optional): List of variable names to maximize. Defaults to None.
        verbose (bool, optional): If True, displays detailed information. Defaults to False.
        max_points (int, optional): Maximum number of points to include in the Pareto front. Defaults to None.

    Returns:
        pd.DataFrame: DataFrame containing the Pareto optimal points.
    """


### Pareto Front

O Pareto Front, ou Fronteira de Pareto, é um conceito fundamental na otimização multiobjetivo. Ele representa um conjunto de soluções que são consideradas eficientes, no sentido de que nenhuma outra solução na busca pode melhorar um objetivo sem piorar pelo menos um dos outros objetivos.

Para entender a Fronteira de Pareto, é útil primeiro entender o conceito de dominância. Uma solução é dita dominar outra se ela for pelo menos tão boa em todos os objetivos e estritamente melhor em pelo menos um deles.

A Fronteira de Pareto consiste em soluções não dominadas. Dentro do espaço de busca, essas são as soluções para as quais não existe nenhuma outra solução que as domine.

A Fronteira de Pareto é amplamente utilizada em problemas de otimização em que vários objetivos conflitantes devem ser otimizados simultaneamente. Isso inclui aplicações em engenharia, economia, logística e muito mais.

A Fronteira de Pareto é uma ferramenta essencial na otimização multiobjetivo, ajudando os decisores a entender e explorar as trocas entre objetivos conflitantes. Ela fornece uma representação clara das soluções ótimas possíveis e ajuda na seleção da solução mais adequada para as necessidades específicas.

In [1]:
import pandas as pd
import asapy

cars = pd.read_csv("./datasets/mtcars.csv")

Analysis = asapy.Analysis()

In [2]:
cars.head(5)

Unnamed: 0.1,Unnamed: 0,mpg,cyl,disp,hp,drat,wt,qsec,vs,am,gear,carb
0,Mazda RX4,21.0,6,160.0,110,3.9,2.62,16.46,0,1,4,4
1,Mazda RX4 Wag,21.0,6,160.0,110,3.9,2.875,17.02,0,1,4,4
2,Datsun 710,22.8,4,108.0,93,3.85,2.32,18.61,1,1,4,1
3,Hornet 4 Drive,21.4,6,258.0,110,3.08,3.215,19.44,1,0,3,1
4,Hornet Sportabout,18.7,8,360.0,175,3.15,3.44,17.02,0,0,3,2


In [3]:
# Define lists of variables to minimize and maximize
list_min = ['cyl']
list_max = ['hp', 'qsec']

# Call pareto_front method
pareto_df = Analysis.pareto_front(cars, list_min, list_max, verbose=False)

# Print the Pareto optimal points
print("\nPareto Optimal Points:")
display(pareto_df)


Pareto Optimal Points:


Unnamed: 0.1,Unnamed: 0,mpg,cyl,disp,hp,drat,wt,qsec,vs,am,gear,carb
3,Hornet 4 Drive,21.4,6,258.0,110,3.08,3.215,19.44,1,0,3,1
5,Valiant,18.1,6,225.0,105,2.76,3.46,20.22,1,0,3,1
6,Duster 360,14.3,8,360.0,245,3.21,3.57,15.84,0,0,3,4
8,Merc 230,22.8,4,140.8,95,3.92,3.15,22.9,1,0,4,2
10,Merc 280C,17.8,6,167.6,123,3.92,3.44,18.9,1,0,4,4
13,Merc 450SLC,15.2,8,275.8,180,3.07,3.78,18.0,0,0,3,3
14,Cadillac Fleetwood,10.4,8,472.0,205,2.93,5.25,17.98,0,0,3,4
15,Lincoln Continental,10.4,8,460.0,215,3.0,5.424,17.82,0,0,3,4
16,Chrysler Imperial,14.7,8,440.0,230,3.23,5.345,17.42,0,0,3,4
20,Toyota Corona,21.5,4,120.1,97,3.7,2.465,20.01,1,0,3,1


#### Analysis.get_best_pareto_point

    """
    Determine the optimal Pareto point from the input DataFrame, considering specified variables and their weights.

    Args:
        df (pd.DataFrame): The input DataFrame.
        list_min (List[str], optional): A list of column names to minimize in the Pareto optimality calculation. Defaults to None.
        list_max (List[str], optional): A list of column names to maximize in the Pareto optimality calculation. Defaults to None.
        weights_min (List[float], optional): A list of weights defining the relative importance of each variable to minimize. Defaults to None.
        weights_max (List[float], optional): A list of weights defining the relative importance of each variable to maximize. Defaults to None.
        minimization_weight (float, optional): The global weight for the minimization part, between 0 and 1. Defaults to 0.5.
        verbose (bool, optional): Flag to display detailed messages. Defaults to False.

    Returns:
        pd.Series: A Pandas Series containing the best Pareto optimal point based on the specified variables and weights.

    Note:
        The function assumes that the input DataFrame contains only Pareto optimal points.
    """

In [4]:
# Define a lista de variáveis e seus pesos correspondentes que serão minimizados
list_min = ['cyl']
weights_min = [1.0]
# Define a lista de variáveis e seus pesos correspondentes que serão maximizados
list_max = ['hp', 'qsec']
weights_max = [0.6, 0.4]

# Chama a função 'get_best_pareto_point' para encontrar o melhor ponto ótimo de Pareto
best_pareto_point = Analysis.get_best_pareto_point(cars, list_min, list_max, weights_min, weights_max, verbose=True)

Best Pareto Optimal Point:
Unnamed: 0    Maserati Bora
mpg                    15.0
cyl                       8
disp                  301.0
hp                      335
drat                   3.54
wt                     3.57
qsec                   14.6
vs                        0
am                        1
gear                      5
carb                      8
Name: 30, dtype: object
