# Códigos para el TFG

## Importamos las librerias necesarias

In [19]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from pysr import PySRRegressor, TemplateExpressionSpec
from sympy import symbols
from sympy.parsing.sympy_parser import parse_expr, standard_transformations, implicit_multiplication_application

def symbolic_regression(df, input_cols, target_col, threshold=0.2):
    X = df[input_cols].values
    y = df[target_col].values

    # Split the data
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.3, random_state=12
    )

    if len(input_cols) == 2:
        spec = TemplateExpressionSpec(
            expressions=["f","g"],
            variable_names=["x0", "x1"],
            combine="f(x0) + g(x1)"
        )
    else:
        spec = TemplateExpressionSpec(
            expressions=["f"],
            variable_names=["x0"],
            combine="f(x0)"
        )

    model = PySRRegressor(
        binary_operators=["+", "-", "*", "/", "^"],
        unary_operators=["exp", "log", "sqrt"],
        model_selection="best",
        verbosity=0,
        constraints={'^': (-2, 2)},
        expression_spec=spec
    )

    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)

    return model.get_best()['equation']

# --------------------------
# Ejemplo para probarla
# --------------------------

# Crear un DataFrame con una función conocida de dos variables
np.random.seed(0)
x = np.random.uniform(-2, 2, 100)
y = np.random.uniform(-2, 2, 100)
z = 3 * x + 2 * y + np.sin(x)  # relación no lineal simple

df = pd.DataFrame({
    "x": x,
    "y": y,
    "z": z
})

# Ejecutar la función
expr = symbolic_regression(df, input_cols=["x", "y"], target_col="z")
print(expr)



# Define the symbols
x0, x1 = symbols("x0 x1")

# Define the local dictionary for variable mapping
local_dict = {"x0": x0, "x1": x1}
expr1 = expr.split(';',1)[0].strip()
expr2 = expr.split(';',1)[1].strip()
rhs1 = expr1.split('=')[1].strip()
rhs2 = expr2.split('=')[1].strip()
rhs1 = rhs1.replace("^", "**")
rhs2 = rhs2.replace("^", "**")
f = rhs1.replace("#1", "x0")
g = rhs2.replace("#1", "x1")

# Define the transformations to handle implicit multiplication
transformations = standard_transformations + (implicit_multiplication_application,)

# Parse the expression
f2 = parse_expr(f, local_dict=local_dict, transformations=transformations)
g2 = parse_expr(g, local_dict=local_dict, transformations=transformations)
print(f2,g2)
from sympy import lambdify

# Create a numerical function
f_numeric = lambdify((x0, x1), f2+g2, modules="numpy")

# Evaluate the function
result = f_numeric(1.0, 2.0)

print(result)




f = (((#1 + exp(#1 / exp((#1 * 0.400728) - -0.47137836))) * 2.1997387) - (1.4390634 / exp(exp(#1 - 0.75097775)))) + -1.3004605; g = #1 + #1
2.1997387*x0 + 2.1997387*exp(0.624141383596996*x0*exp(-0.400728*x0)) - 1.3004605 - 1.4390634*exp(-0.471904922060547*exp(x0)) 2*x1
7.841734441220234


### Visualización

### Análisis de datos

### Algorítmos

## Abrimos los archivos

### Datos de masa

#### Mostramos los datos de la masa

### Datos del redshift

#### Mostramos los datos del redshift

### Datos de propiedades físicas

#### Mostramos los datos de las propiedades físicas

## Análisis preliminar de los datos

### Creamos unos reports para ver la forma de los datos 

### Análisis de las relaciones en 2 dimensiones

### Análisis de las relaciones en 3 dimensiones

## Modelos de regressión simbólica

### Análisis de las relaciones en 2 dimensiones

### Análisis de las relaciones en 3 dimensiones