Εφαρμογή Δομικής Βιοπληροφορικής για πρόβλεψη δραστικότητας μορίων απέναντι σε πολλαπλούς πρωτεϊνικούς στόχους.
Το σύστημα χρησιμοποιεί RDKit molecular fingerprints (ECFP/Morgan) και Machine Learning μοντέλα (Random Forest / Gradient Boosting) για την ταξινόμηση μορίων ως Ενεργά ή Ανενεργά.
- Προβλέπει δραστικότητα για πολλές πρωτεΐνες (AChE, BACE1, NMDA, MAO-A, MAO-B κ.λπ.)
- Υποστηρίζει:
- ✔ Μοναδικό SMILES input
- ✔ Μαζική πρόβλεψη μέσω CSV αρχείου
- Οπτική απεικόνιση του μορίου (RDKit)
- Πρόβλεψη + πιθανότητα πρόβλεψης (probability score)
- Ιστορικό προβλέψεων
- Δημιουργία γραφημάτων για CSV mode
Μοριακή Αναπαράσταση – Morgan Fingerprints
Κάθε μόριο μετατρέπεται σε δυαδικό διάνυσμα 1024 bits χρησιμοποιώντας:
- RDKit
- Morgan/ECFP (radius = 2)
Αυτό το fingerprint κωδικοποιεί τη τοπολογική χημική δομή και χρησιμοποιείται ως είσοδος στο μοντέλο.
Μοντέλα Μηχανικής Μάθησης
Τα μοντέλα έχουν εκπαιδευτεί σε datasets δραστικότητας και αποθηκεύονται ως: .joblib.
Τύποι μοντέλων:
Random Forest Classifier
Gradient Boosting Classifier
Η πρόβλεψη δίνεται ως:
Prediction ∈ {Active, Inactive}
Probability ∈ [0–1]