In [5]:

import pandas as pd
import numpy as np
from sklearn.metrics import mean_squared_error
from scipy.stats import pearsonr



In [3]:
# Dados fornecidos
dados = {
    "Profundidade(m)": [1500, 1000, 500, 0, -500, -1000],
    "Densidade(g/cm^3)": [2.43, 2.42, 2.63, 2.63, 2.63, 2.63],
    "Resistividade(ohm.m)": [5.46, 7.48, 13.87, 118.00, 324.27, 896.18],
    "VP(km/s)": [1.50, 2.78, 4.96, 5.82, 5.82, 5.82],
    "Densidade_valid(km/s)": [2.23, 2.37, 2.53, 2.63, 2.52, None],
    "Resistividade_AT10_valid(km/s)": [0.9, 11.8, 1655.8, 1950, 1950, None],
    "Resistividade_AT30_valid(km/s)": [56.6, 9.3, 96.7, 198.8, 427.2, None],
    "Resistividade_AT90_valid(km/s)": [5.7, 9.3, 103.5, 354.9, 423.7, None],
    "VP_valid(km/s)": [None, 3.95, 5.67, 5.81, 5.77, None]
    
}

# Cria o DataFrame
df = pd.DataFrame(dados)

# Exibe o DataFrame
print(df)

   Profundidade(m)  Densidade(g/cm^3)  Resistividade(ohm.m)  VP(km/s)  \
0             1500               2.43                  5.46      1.50   
1             1000               2.42                  7.48      2.78   
2              500               2.63                 13.87      4.96   
3                0               2.63                118.00      5.82   
4             -500               2.63                324.27      5.82   
5            -1000               2.63                896.18      5.82   

   Densidade_valid(km/s)  Resistividade_AT10_valid(km/s)  \
0                   2.23                             0.9   
1                   2.37                            11.8   
2                   2.53                          1655.8   
3                   2.63                          1950.0   
4                   2.52                          1950.0   
5                    NaN                             NaN   

   Resistividade_AT30_valid(km/s)  Resistividade_AT90_valid(km/s)  

In [6]:
# Função para calcular métricas
def calcular_metricas(col1, col2):
    # Remove valores nulos
    valid_data = df[[col1, col2]].dropna()
    x = valid_data[col1].values
    y = valid_data[col2].values

    # MSE
    mse = mean_squared_error(x, y)
    # RMSE
    rmse = np.sqrt(mse)
    # Correlação de Pearson
    if len(x) > 1:
        corr, _ = pearsonr(x, y)
    else:
        corr = np.nan  # Sem dados suficientes para correlação
    
    return mse, rmse, corr

# Calcula as métricas para cada par
pares = [
    ("Densidade(g/cm^3)", "Densidade_valid(km/s)"),
    ("Resistividade(ohm.m)", "Resistividade_AT10_valid(km/s)"),
    ("Resistividade_AT30_valid(km/s)", "Resistividade_AT90_valid(km/s)"),
    ("VP(km/s)", "VP_valid(km/s)")
]

# Cria listas para o resumo
metricas = []
for col1, col2 in pares:
    mse, rmse, corr = calcular_metricas(col1, col2)
    metricas.append({
        "Comparação": f"{col1} vs {col2}",
        "MSE": mse,
        "RMSE": rmse,
        "Correlação": corr
    })

# Cria um DataFrame com as métricas
df_metricas = pd.DataFrame(metricas)

# Exibe os resultados
print(df_metricas)

                                          Comparação           MSE  \
0         Densidade(g/cm^3) vs Densidade_valid(km/s)  1.292000e-02   
1  Resistividade(ohm.m) vs Resistividade_AT10_val...  1.739039e+06   
2  Resistividade_AT30_valid(km/s) vs Resistividad...  5.403302e+03   
3                         VP(km/s) vs VP_valid(km/s)  4.689000e-01   

          RMSE  Correlação  
0     0.113666    0.897943  
1  1318.726326    0.649666  
2    73.507156    0.920501  
3     0.684763    0.974942  


In [8]:
# Cria uma cópia do DataFrame original para formatar
df_metricas_2dec = df_metricas.copy()

# Arredondando as colunas numéricas para duas casas decimais
df_metricas_2dec["MSE"] = df_metricas_2dec["MSE"].round(2)
df_metricas_2dec["RMSE"] = df_metricas_2dec["RMSE"].round(2)
df_metricas_2dec["Correlação"] = df_metricas_2dec["Correlação"].round(2)

# Exibe o DataFrame arredondado
print(df_metricas_2dec)


                                          Comparação         MSE     RMSE  \
0         Densidade(g/cm^3) vs Densidade_valid(km/s)        0.01     0.11   
1  Resistividade(ohm.m) vs Resistividade_AT10_val...  1739039.12  1318.73   
2  Resistividade_AT30_valid(km/s) vs Resistividad...     5403.30    73.51   
3                         VP(km/s) vs VP_valid(km/s)        0.47     0.68   

   Correlação  
0        0.90  
1        0.65  
2        0.92  
3        0.97  


In [9]:
import pandas as pd
import numpy as np

# Dados fornecidos
dados = {
    "Profundidade(m)": [1500, 1000, 500, 0, -500, -1000],
    "Densidade(g/cm^3)": [2.43, 2.42, 2.63, 2.63, 2.63, 2.63],
    "Resistividade(ohm.m)": [5.46, 7.48, 13.87, 118.00, 324.27, 896.18],
    "VP(km/s)": [1.50, 2.78, 4.96, 5.82, 5.82, 5.82],
    "Densidade_valid(km/s)": [2.23, 2.37, 2.53, 2.63, 2.52, None],
    "Resistividade_AT10_valid(km/s)": [0.9, 11.8, 1655.8, 1950, 1950, None],
    "Resistividade_AT30_valid(km/s)": [56.6, 9.3, 96.7, 198.8, 427.2, None],
    "Resistividade_AT90_valid(km/s)": [5.7, 9.3, 103.5, 354.9, 423.7, None],
    "VP_valid(km/s)": [None, 3.95, 5.67, 5.81, 5.77, None]
}

# Cria o DataFrame original
df = pd.DataFrame(dados)

# Cria o DataFrame com erros absolutos
df_erros_absoluto = pd.DataFrame({
    "Profundidade(m)": df["Profundidade(m)"],
    
    # Densidade
    "Densidade_Erro_Absoluto": abs(df["Densidade(g/cm^3)"] - df["Densidade_valid(km/s)"]),
    
    # Resistividades
    "Resistividade_AT10_Erro_Absoluto": abs(df["Resistividade(ohm.m)"] - df["Resistividade_AT10_valid(km/s)"]),
    "Resistividade_AT30_Erro_Absoluto": abs(df["Resistividade(ohm.m)"] - df["Resistividade_AT30_valid(km/s)"]),
    "Resistividade_AT90_Erro_Absoluto": abs(df["Resistividade(ohm.m)"] - df["Resistividade_AT90_valid(km/s)"]),
    
    # VP
    "VP_Erro_Absoluto": abs(df["VP(km/s)"] - df["VP_valid(km/s)"])
})

# Remove a linha com Profundidade = -1000
df_erros_absoluto_sem_neg1000 = df_erros_absoluto[df_erros_absoluto["Profundidade(m)"] != -1000]

# Exibe o DataFrame sem a profundidade -1000
print(df_erros_absoluto_sem_neg1000)


   Profundidade(m)  Densidade_Erro_Absoluto  Resistividade_AT10_Erro_Absoluto  \
0             1500                     0.20                              4.56   
1             1000                     0.05                              4.32   
2              500                     0.10                           1641.93   
3                0                     0.00                           1832.00   
4             -500                     0.11                           1625.73   

   Resistividade_AT30_Erro_Absoluto  Resistividade_AT90_Erro_Absoluto  \
0                             51.14                              0.24   
1                              1.82                              1.82   
2                             82.83                             89.63   
3                             80.80                            236.90   
4                            102.93                             99.43   

   VP_Erro_Absoluto  
0               NaN  
1              1.17  
2       