In [1]:
import pandas as pd
import pubchempy as pcp

# Chemin vers ton fichier CSV
input_csv = "photocompounds_database.csv"
output_csv = "photocompounds_database_pubchem.csv"

# Charger le fichier CSV
data = pd.read_csv(input_csv, sep=";")

In [2]:
# Colonnes à ajouter
new_columns = ["Molecular Weight", "Chemical Formula", "SMILES", 
               "H-Bond Donor Count", "H-Bond Acceptor Count", 
               "Solubility", "Melting Point", "Boiling Point", "pKa"]

# Ajouter les nouvelles colonnes si elles n'existent pas encore
for col in new_columns:
    if col not in data.columns:
        data[col] = ""

# Remplir les nouvelles colonnes
for index, row in data.iterrows():
    cas_number = row["CAS"]
    try:
        # Récupérer les informations depuis PubChem
        compound = pcp.get_compounds(cas_number, "name")
        if compound:
            comp = compound[0]
            data.at[index, "Molecular Weight"] = comp.molecular_weight
            data.at[index, "Chemical Formula"] = comp.molecular_formula
            data.at[index, "SMILES"] = comp.canonical_smiles
            data.at[index, "H-Bond Donor Count"] = comp.h_bond_donor_count
            data.at[index, "H-Bond Acceptor Count"] = comp.h_bond_acceptor_count
            
            # Extraire les propriétés supplémentaires
            properties = comp.to_dict()
            data.at[index, "Solubility"] = properties.get("Solubility", "")
            data.at[index, "Melting Point"] = properties.get("Melting Point", "")
            data.at[index, "Boiling Point"] = properties.get("Boiling Point", "")
            data.at[index, "pKa"] = properties.get("pKa", "")

            print(f"✅ Informations ajoutées pour le CAS {cas_number}")
        else:
            print(f"⚠️ Aucune information trouvée pour le CAS {cas_number}")
    except Exception as e:
        print(f"⚠️ Erreur pour le CAS {cas_number} : {e}")

✅ Informations ajoutées pour le CAS 71-43-2
✅ Informations ajoutées pour le CAS 108-88-3
✅ Informations ajoutées pour le CAS 95-47-6
✅ Informations ajoutées pour le CAS 108-38-3
✅ Informations ajoutées pour le CAS 106-42-3
✅ Informations ajoutées pour le CAS 108-67-8
✅ Informations ajoutées pour le CAS 95-93-2
✅ Informations ajoutées pour le CAS 700-12-9
✅ Informations ajoutées pour le CAS 87-85-4
✅ Informations ajoutées pour le CAS 108-95-2
✅ Informations ajoutées pour le CAS 100-66-3
✅ Informations ajoutées pour le CAS 100-47-0
✅ Informations ajoutées pour le CAS 100-52-7
✅ Informations ajoutées pour le CAS 65-85-0
✅ Informations ajoutées pour le CAS 98-86-2
✅ Informations ajoutées pour le CAS 62-53-3
✅ Informations ajoutées pour le CAS 121-69-7
✅ Informations ajoutées pour le CAS 59-88-1
✅ Informations ajoutées pour le CAS 108-90-7
✅ Informations ajoutées pour le CAS 591-50-4
✅ Informations ajoutées pour le CAS 98-95-3
✅ Informations ajoutées pour le CAS 100-42-5
✅ Informations ajou

In [3]:
# Sauvegarder le fichier enrichi
data.to_csv(output_csv, sep=",", index=False)
print("\n✅ Fichier enrichi sauvegardé sous :", output_csv)


✅ Fichier enrichi sauvegardé sous : photocompounds_database_pubchem.csv
