In [1]:
import pubchempy as pcp
import pandas as pd

from rdkit import Chem
from rdkit.Chem import Descriptors
from rdkit.Chem import rdMolDescriptors
from rdkit.Chem import Fragments
from rdkit.Chem.Draw import MolToImage

from PIL import ImageTk
import tkinter as tk

In [2]:
def obter_informacoes_molecula(mol):
    nome = mol
    compound = pcp.get_compounds(mol, 'name')
    smiles = compound[0].isomeric_smiles
    mol = Chem.MolFromSmiles(smiles)
    
    # Verificar se o SMILES foi convertido corretamente em uma molécula
    if mol is None:
        print(f"Erro ao processar o SMILES: {smiles}")
        return None
    
    informacoes = {
    "SMILES": smiles,
    "Nome": nome,
    "Fórmula Molecular": Chem.rdMolDescriptors.CalcMolFormula(mol),
    "Massa Molecular": Chem.rdMolDescriptors.CalcExactMolWt(mol),
    "Número de Átomos": mol.GetNumAtoms(),
    "Número de Ligações": mol.GetNumBonds(),
    "Área de Superfície": Chem.rdMolDescriptors.CalcTPSA(mol),
    "LogP": Chem.Crippen.MolLogP(mol),
    "Anéis Aromáticos": Chem.rdMolDescriptors.CalcNumAromaticRings(mol),
    "Número de Anéis": Chem.rdMolDescriptors.CalcNumRings(mol),
    "Número de Rotâmeros": Chem.rdMolDescriptors.CalcNumRotatableBonds(mol),
    "Polaridade": Chem.Descriptors.TPSA(mol),
    "Raio Molecular": Chem.Crippen.MolMR(mol)
    # Adicione outras informações desejadas
    }
    
    try:
        # Obter informações adicionais do PubChem
        composto = pcp.get_compounds(smiles, 'smiles')
        if composto:
            resultado = composto[0]
            
            if 'melting_point' in resultado.props:
                informacoes['Ponto de Fusão'] = resultado.props['melting_point']
            
            if 'boiling_point' in resultado.props:
                informacoes['Ponto de Ebulição'] = resultado.props['boiling_point']
    
    except Exception as e:
        print(f"Erro ao obter informações do PubChem: {e}")

    return informacoes

In [3]:
obter_informacoes_molecula('ethylene')

Erro ao obter informações do PubChem: 'Compound' object has no attribute 'props'


{'SMILES': 'C=C',
 'Nome': 'ethylene',
 'Fórmula Molecular': 'C2H4',
 'Massa Molecular': 28.031300127999998,
 'Número de Átomos': 2,
 'Número de Ligações': 1,
 'Área de Superfície': 0.0,
 'LogP': 0.8022,
 'Anéis Aromáticos': 0,
 'Número de Anéis': 0,
 'Número de Rotâmeros': 0,
 'Polaridade': 0.0,
 'Raio Molecular': 11.254000000000001}

In [16]:
obter_informacoes_molecula('fitc')

Erro ao obter informações do PubChem: 'Compound' object has no attribute 'props'


{'SMILES': 'C1=CC2=C(C=C1N=C=S)C(=O)OC23C4=C(C=C(C=C4)O)OC5=C3C=CC(=C5)O',
 'Nome': 'fitc',
 'Fórmula Molecular': 'C21H11NO5S',
 'Massa Molecular': 389.03579345199995,
 'Número de Átomos': 28,
 'Número de Ligações': 32,
 'Área de Superfície': 88.35000000000001,
 'LogP': 4.400100000000004,
 'Anéis Aromáticos': 3,
 'Número de Anéis': 5,
 'Número de Rotâmeros': 1,
 'Polaridade': 88.35000000000001,
 'Raio Molecular': 102.7131}

In [18]:
molecule = input("Molecule name: ")

try:
    df = pcp.get_compounds(molecule, 'name', as_dataframe=True)
    smiles = df["canonical_smiles"]
except:
    print('Unknown molecule name.')

results = pcp.get_compounds(molecule, 'name')
for compound in results:
    print(compound)
    mol = Chem.MolFromSmiles(compound.isomeric_smiles)
    print(Chem.rdMolDescriptors.CalcMolFormula(mol))

    # Criar uma janela popup
    window = tk.Tk()

    # Mostrar a imagem do benzeno em uma janela popup
    img = MolToImage(mol)
    photo = ImageTk.PhotoImage(img)
    label = tk.Label(window, image=photo)
    label.pack()
    window.title(f"{molecule}")
    window.mainloop()

Compound(18730)
C21H11NO5S


In [8]:
compound = pcp.get_compounds("fitc", 'name')

mol = Chem.MolFromSmiles(compound[0].isomeric_smiles)  # Exemplo de uma molécula (acetato)

print("Número de ácidos carboxilicos alifáticos: ", Fragments.fr_Al_COO(mol),
"Número de hidroxilas alifáticas: ", Fragments.fr_Al_OH(mol),
"Número de hidroxilas alifáticas excluindo tert-OH: ", Fragments.fr_Al_OH_noTert(mol),
"Número de grupos funcionais N ligado à aromáticos: ", Fragments.fr_ArN(mol),
"Número de ácidos carboxilicos aromáticos: ", Fragments.fr_Ar_COO(mol),
"Número de nitrogênios aromáticos: ", Fragments.fr_Ar_N(mol),
"Número de aminas aromáticas: ", Fragments.fr_Ar_NH(mol),
"Número de hidroxilas aromáticas: ", Fragments.fr_Ar_OH(mol),
"Número de ácidos carboxilicos ", Fragments.fr_COO(mol),
"Número de ácidos carboxílicos: ", Fragments.fr_COO2(mol),
"Número de carbonilas O", Fragments.fr_C_O(mol),
"Número de carbonilas O excluindo COOH", Fragments.fr_C_O_noCOO(mol),
"Número de tiocarbonilas", Fragments.fr_C_S(mol),
"Número de C(OH)CCN-Ctert-alkyl ou C(OH)CCNcyclic", Fragments.fr_HOCCN(mol),
"Número de iminas", Fragments.fr_Imine(mol),
"Número de aminas", Fragments.fr_NH0(mol),
"Número de aminas secundárias", Fragments.fr_NH1(mol),
"Número de aminas primárias", Fragments.fr_NH2(mol),
"Número de hidroxilaminas", Fragments.fr_N_O(mol),
"Número de XCCNR", Fragments.fr_Ndealkylation1(mol),
"Número de aminas terc-alicíclicas", Fragments.fr_Ndealkylation2(mol),
"Número de nitrogênios H-Pirrol", Fragments.fr_Nhpyrrole(mol),
"Número de grupos tiol", Fragments.fr_SH(mol),
"Número de aldeídos", Fragments.fr_aldehyde(mol),
"Número de alquil carbamatos (sujeitos a hidrólise)", Fragments.fr_alkyl_carbamate(mol),
"Número de haletos de alquila", Fragments.fr_alkyl_halide(mol),
"Número de isotiocianatos", Fragments.fr_isothiocyan(mol),
"Número de sítios de oxidação alílica excluindo dienona esteróide", Fragments.fr_allylic_oxid(mol),
"Número de amidas", Fragments.fr_amide(mol),
"Número de grupos de amidina", Fragments.fr_amidine(mol),
"Número de anilinas", Fragments.fr_aniline(mol),
"Número de sítios aril metil para hidroxilação", Fragments.fr_aryl_methyl(mol),
"Número de azidas", Fragments.fr_azide(mol),
"Número de grupos azo", Fragments.fr_azo(mol),
"Número de grupos de barbitúricos", Fragments.fr_barbitur(mol),
"Número de anéis de benzeno", Fragments.fr_benzene(mol),
"Número de benzodiazepínicos sem anéis fundidos adicionais", Fragments.fr_benzodiazepine(mol),
"Número de biciclicos", Fragments.fr_bicyclic(mol),
"Número de grupos diazo", Fragments.fr_diazo(mol),
"Número de diidropiridinas", Fragments.fr_dihydropyridine(mol),
"Número de anéis de expóxido", Fragments.fr_epoxide(mol),
"Número de ésters", Fragments.fr_ester(mol),
"Número de éters", Fragments.fr_ether(mol),
"Número de furano", Fragments.fr_furan(mol),
"Número de grupos guanidina", Fragments.fr_guanido(mol),
"Número de halogênios", Fragments.fr_halogen(mol),
"Número de grupos de hidrazina", Fragments.fr_hdrzine(mol),
"Número de grupos de hidrazona", Fragments.fr_hdrzone(mol),
"Número de anéis de imidazol", Fragments.fr_imidazole(mol),
"Número de grupos imide", Fragments.fr_imide(mol),
"Número de isocianatos", Fragments.fr_isocyan(mol),
"Número de tioéteres", Fragments.fr_sulfide(mol),
"Número de cetonas", Fragments.fr_ketone(mol),
"Número de cetonas excluindo diaril, a,b-insat. dienonas, heteroátomo em Calpha", Fragments.fr_ketone_Topliss(mol),
"Número de beta lactâmicos", Fragments.fr_lactam(mol),
"Número de ésteres cíclicos (lactonas)", Fragments.fr_lactone(mol),
"Número de grupos metoxi -OCH3", Fragments.fr_methoxy(mol),
"Número de anéis de morfolina", Fragments.fr_morpholine(mol),
"Número de nitrilos", Fragments.fr_nitrile(mol),
"Número de grupos nitro", Fragments.fr_nitro(mol),
"Número de substituintes do anel nitro benzeno", Fragments.fr_nitro_arom(mol),
"Número de substituintes do anel nitro benzeno não orto", Fragments.fr_nitro_arom_nonortho(mol),
"Número de grupos nitroso excluindo NO2", Fragments.fr_nitroso(mol),
"Número de anéis de oxazol", Fragments.fr_oxazole(mol),
"Número de grupos oxima", Fragments.fr_oxime(mol),
"Número de locais de para-hidroxilação", Fragments.fr_para_hydroxylation(mol),
"Número de fenóis", Fragments.fr_phenol(mol),
"Número de OH fenólico excluindo substituintes Hbond intramoleculares orto", Fragments.fr_phenol_noOrthoHbond(mol),
"Número de grupos de ácido fosfórico", Fragments.fr_phos_acid(mol),
"Número de grupos éster fosfórico", Fragments.fr_phos_ester(mol),
"Número de anéis de piperdina", Fragments.fr_piperdine(mol),
"Número de anéis de piperzina", Fragments.fr_piperzine(mol),
"Número de amidas primárias", Fragments.fr_priamide(mol),
"Número de sulfonamidas primárias", Fragments.fr_prisulfonamd(mol),
"Número de anéis de piridina", Fragments.fr_pyridine(mol),
"Número de nitrogênios quaternários", Fragments.fr_quatN(mol),
"Número de sulfonamidas", Fragments.fr_sulfonamd(mol),
"Número de grupos sulfona", Fragments.fr_sulfone(mol),
"Número de acetilenos terminais", Fragments.fr_term_acetylene(mol),
"Número de anéis de tetrazol", Fragments.fr_tetrazole(mol),
"Número de anéis tiazólicos", Fragments.fr_thiazole(mol),
"Número de tiocianatos", Fragments.fr_thiocyan(mol),
"Número de anéis de tiofeno", Fragments.fr_thiophene(mol),
"Número de alcanos não ramificados de pelo menos 4 membros (exclui alcanos halogenados)", Fragments.fr_unbrch_alkane(mol),
"Número de grupos de ureia", Fragments.fr_urea(mol), sep='\n')

Número de ácidos carboxilicos alifáticos: 
0
Número de hidroxilas alifáticas: 
0
Número de hidroxilas alifáticas excluindo tert-OH: 
0
Número de grupos funcionais N ligado à aromáticos: 
0
Número de ácidos carboxilicos aromáticos: 
0
Número de nitrogênios aromáticos: 
0
Número de aminas aromáticas: 
0
Número de hidroxilas aromáticas: 
2
Número de ácidos carboxilicos 
0
Número de ácidos carboxílicos: 
0
Número de carbonilas O
1
Número de carbonilas O excluindo COOH
1
Número de tiocarbonilas
1
Número de C(OH)CCN-Ctert-alkyl ou C(OH)CCNcyclic
0
Número de iminas
1
Número de aminas
1
Número de aminas secundárias
0
Número de aminas primárias
0
Número de hidroxilaminas
0
Número de XCCNR
0
Número de aminas terc-alicíclicas
0
Número de nitrogênios H-Pirrol
0
Número de grupos tiol
0
Número de aldeídos
0
Número de alquil carbamatos (sujeitos a hidrólise)
0
Número de haletos de alquila
0
Número de isotiocianatos
1
Número de sítios de oxidação alílica excluindo dienona esteróide
0
Número de amidas
