In [39]:
from hempy.molecule_properties import calculate_molecular_similarity
import numpy as np
from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit import DataStructs
from sklearn.metrics import pairwise_distances

In [40]:
def test_calculate_molecular_similarity():
   # Exemple de molécules (vous pouvez les remplacer par vos propres molécules)
    mol_1 = Chem.MolFromSmiles("CCO")  # Exemple de molécule 1 (éthanol)
    mol_2 = Chem.MolFromSmiles("CC(=O)O")  # Exemple de molécule 2 (acide acétique)

    # Générer des empreintes moléculaires pour le THC et le CBD
    fp_1 = AllChem.GetMorganFingerprintAsBitVect(mol_1, 2, nBits=1024)
    fp_2 = AllChem.GetMorganFingerprintAsBitVect(mol_2, 2, nBits=1024)

    # Convertir en vecteurs numpy
    array_1 = np.zeros((1,))
    array_2 = np.zeros((1,))
    DataStructs.ConvertToNumpyArray(fp_1, array_1)
    DataStructs.ConvertToNumpyArray(fp_2, array_2)
    
    # Calculer la similarité de Jaccard
    similarity_jaccard = 1 - pairwise_distances(array_1.reshape(1, -1), array_2.reshape(1, -1), metric="jaccard")[0][0]

    # Calculer la similarité de Tanimoto
    similarity_tanimoto = DataStructs.TanimotoSimilarity(fp_1, fp_2)

    return similarity_jaccard, similarity_tanimoto
    


In [43]:
similarity_jaccard, similarity_tanimoto = test_calculate_molecular_similarity()
print(f"Similarité de Jaccard : {similarity_jaccard:.4f}")
print(f"Similarité de Tanimoto : {similarity_tanimoto:.4f}")

mol_1_smiles = "CCO"
mol_2_smiles = "CC(=O)O"

mol_1 = Chem.MolFromSmiles(mol_1_smiles)
mol_2 = Chem.MolFromSmiles(mol_2_smiles)

similarity_jaccard_ex, similarity_tanimoto_ex = calculate_molecular_similarity(mol_1,mol_2)
print("Similarity (Jaccard):", similarity_jaccard_ex)
print("Similarity (Tanimoto):", similarity_tanimoto_ex)

Similarité de Jaccard : 0.1818
Similarité de Tanimoto : 0.1818
Similarity (Jaccard): 0.18181818181818177
Similarity (Tanimoto): 0.18181818181818182


