In [35]:
import pandas as pd
import numpy as np
from rdkit import Chem

def convert_ug_ml_to_nM(ug_ml, molecular_weight):
    """
    Converta a concentração de µg/mL para nM/mL.
    
    Parâmetros:
    ug_ml (float): Concentração em µg/mL
    molecular_weight (float): Peso molecular em g/mol
    
    Retorna:
    float: Concentração em nM/mL
    """
    # Fator de conversão de µg para g
    conversion_factor = 1e-6
    
    # Converta µg/mL para g/mL
    g_ml = ug_ml * conversion_factor
    
    # Converta g/mL para molar (M) usando o peso molecular (g/mol)
    molar_concentration = g_ml / molecular_weight
    
    # Converta M para nM (1 M = 10^9 nM)
    nM_ml = molar_concentration * 1e9
    
    return nM_ml


In [None]:
df = pd.read_excel(r"D:\OneDrive\Documentos\LabMol\QSARLit Colab\automated-qsar-framework-master\malaria\data_sets\bioactivity-18_17_57_08.xls.xlsx")
df.head()

In [None]:
df = df.loc[:, ['CANONICAL_SMILES', 'STANDARD_VALUE', 'STANDARD_UNITS', 'MOLWEIGHT']]
df = df.dropna(subset=['STANDARD_VALUE'])

if 'ug.mL-1' in df['STANDARD_UNITS']:
    df['STANDARD_VALUE'] = df.apply(lambda x: convert_ug_ml_to_nM(x['STANDARD_VALUE'], x['MOLWEIGHT']), axis=1)
    df['STANDARD_UNITS'] = 'nM'
else:
    df['STANDARD_UNITS'] = 'nM'
df

In [None]:
for a in df['STANDARD_VALUE']:
    a/1000
    df['STANDARD_UNITS'] = 'uM'

df['pI50 (uM)'] = -np.log10(df['STANDARD_VALUE'] / 1e6)
df['binary'] = df['pI50 (uM)'].apply(lambda x: 1 if x >= 6 else 0)
df

In [40]:
df.to_csv(r"D:\OneDrive\Documentos\LabMol\QSARLit Colab\automated-qsar-framework-master\malaria\data_sets\bioactivity_data_prepared.csv", index=False)