16
ΣΧΕΔΙΑΣΗ ΦΑΡΜΑΚΩΝ ΜΕ ΧΡΗΣΗ ΑΛΓΟΡΙΘΜΩΝ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Μηχανική Μάθηση Παπαβασιλείου Αναστασία ΑΕΜ 402 Δεληγιαννάκου Αγαθονίκη ΑΕΜ 390

Drug design

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Drug design

ΣΧΕΔΙΑΣΗ ΦΑΡΜΑΚΩΝ ΜΕ ΧΡΗΣΗ ΑΛΓΟΡΙΘΜΩΝ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣΜηχανική Μάθηση

Παπαβασιλείου Αναστασία ΑΕΜ 402

Δεληγιαννάκου Αγαθονίκη ΑΕΜ 390

Page 2: Drug design

10

/04

/20

23

2

ΠΕΡΙΕΧΟΜΕΝΑ

Εισαγωγή Ανακάλυψη και Σχεδιασμός Φαρμάκων Μηχανική Μάθηση Δένδρα Απόφασης Αναβλητική Μάθηση – kNN Μάθηση κατά Bayes Μηχανές Διανυσμάτων Υποστήριξης – SVMs Εφαρμογές Μελλοντικές Κατευθύνσεις

Page 3: Drug design

10

/04

/20

23

3

ΕΙΣΑΓΩΓΗ

Η ανακάλυψη φαρμάκων είναι μια από τις πιο πολύπλοκες, χρονοβόρες και ακριβές διαδικασίες.

Τα τελευταία χρόνια έχει γίνει δραματική πρόοδος στη βασισμένη-στον-υπολογιστή ανακάλυψη φαρμάκων, μέθοδος αποδοτική και με χαμηλότερο κόστος.

Αυτό συμβαίνει εξαιτίας της προόδου στην ανάλυση των βιολογικών και χημικών δεδομένων με τη χρήση των μοντέρνων τεχνικών ΜΜ.Για παράδειγμα, οι αλγόριθμοι ταξινόμησης χρησιμοποιούνται συχνά για να ταυτοποιήσουν ενεργές και μη-ενεργές ενώσεις, ενώ οι προσεγγίσεις παλινδρόμησης εφαρμόζονται στην εκπαίδευση και την πρόβλεψη συνεχών δεδομένων.

Page 4: Drug design

10

/04

/20

23

4

ΑΝΑΚΑΛΥΨΗ & ΣΧΕΔΙΑΣΜΟΣ ΦΑΡΜΑΚΩΝ

Ανακάλυψη ένωσης οδηγού

Σύνθεση ένωσης οδηγού

ΧαρακτηρισμόςΑνάλυση

Έλεγχος

Παραγωγή φαρμάκου

-γονίδιο-πρωτεΐνη-χημική ένωση

-χαρακτηριστικά-φυσικο-χημικές ιδιότητες-βιολογική δράση-Τοξικότητα-μεταλλαξιογένεση-χημική

ανάλυση-τοξικότητα

-ανάλυση δομής-δράσης-μοριακή ανάλυση

Page 5: Drug design

10

/04

/20

23

5

ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ Απόσπαση πληροφοριών από πειραματικά δεδομένα από τις

υπολογιστικές και στατιστικές μεθόδους .

Δημιουργία ενός συνόλου κανόνων, λειτουργιών ή διαδικασιών που τους επιτρέπουν να προβλέπουν τις ιδιότητες των νέων αντικειμένων που δεν περιλαμβάνονται στο σύνολο εκπαίδευσης.

Στο σχεδιασμό των φαρμάκων ο στόχος είναι να μάθουν πως η χημική δομή καθορίζει κάποια σημαντική ιδιότητα των φαρμάκων, όπως:

- φυσικο-χημικές ιδιότητες (διαλυτότητα στο νερό) - βιολογική δράση (αναστολή ενζύμων) - μεταβολισμός - τοξικότητα - μεταλλαξιογένεση

Κάθε μόριο σχετίζεται με ένα σύνολο περιγραφέων δομής και μία πειραματική ιδιότητά του.

Οι περιγραφείς δομής χρησιμοποιούνται ως είσοδο (input) σε έναν αλγόριθμο μηχανικής μάθησης και είναι χαρακτηριστικό της χημικής δομής.

Το πείραμα είναι ο στόχος (output) του μοντέλου και μπορεί να είναι μια ετικέτα κλάσης (1 / - 1), όπως διαλυτό / μη διαλυτό, αναστολέας / μη-αναστολέας, υποκατάστατο / μη-υποκατάστατο, τοξικό / μη-τοξικό, μεταλλαξιογόνο / μη- μεταλλαξιογόνο ή καρκινογόνο/μη-καρκινογόνο.

Page 6: Drug design

10

/04

/20

23

6

ΑΛΓΟΡΙΘΜΟΙ ΜΜ [1/3]

Παράγει μια σειρά από κανόνες με βάση τον διαχωρισμό των ενώσεων. Ο διαχωρισμός βασίζεται σε 2 υποομάδες Οι υποομάδες δημιουργούνται με βάση επιλεγμένους περιγραφείς δομής των

ενώσεων. - 1η υποομάδα: αξία μικρότερη από το όριο του περιγραφέα που καθορίζεται, - 2η υποομάδα: αξία μεγαλύτερη από το συγκεκριμένο όριο. Ο περιγραφέας και το όριο επιλέγονται έτσι ώστε να μεγιστοποιείται η διαφορά

στην εντροπία, η οποία μεγιστοποιεί το διαχωρισμό των ενώσεων ανάλογα με την κλάση τους.

Η διαδικασία επαναλαμβάνεται μέχρι ο κατάλληλος διαχωρισμός σε τάξεις να πραγματοποιηθεί για όλες τις ενώσεις.

Παράδειγμα (a) Ταξινόμηση χημικών τύπων(όπως φαινόλες) με χρήση του C4.5 δέντρου

απόφασης Σύνολο δεδομένων: 190 ενώσεις (76 πολικές (κατηγορία 1) και 114 μη

πολικές(κατηγορία 2)) logΚow =>περιγραφέας δομής(συμμετοχή των οκτανίων νερού) Ehomo => μέγιστη ενέργεια μοριακών τροχών Elumo => ελάχιστη ενέργεια μοριακών τροχών Q- => αρνητική μερική φόρτιση σε μη-υδρογόνο άτομο μορίου Q+ => θετική μερική φόρτιση σε υδρογόνο άτομο

Δένδρα Απόφασης

Page 7: Drug design

10

/04

/20

23

7

ΑΛΓΟΡΙΘΜΟΙ ΜΜ [2/3]Δένδρα Απόφασης

Page 8: Drug design

10

/04

/20

23

8

ΑΛΓΟΡΙΘΜΟΙ ΜΜ [3/3]

Παράδειγμα (b) Τοξικότητα των φαινολών στην χημική ανάλυση

της Tetrahymena pyriformis -πολικά φάρμακα (κατηγορία 1),μονομερή οξειδωτικά (κατηγορία 2),προ-ηλεκτρόφιλα (κατηγορία 3) και μερικώς ηλεκτρόφιλα(κατηγορία 4).

220 χημικές ουσίες και 7 περιγραφείς δομής logΚow , Ehomo , Elumo , D_C-maxE , D_C-avN ,

N_Hdon και N_Hacc Ο logKow δεν έχει επιλεγεί ως κανόνας

διαχωρισμού, ενώ ο Ehomo και ο N_Hacc επιλέγονται σε δύο κανόνες το καθένα.

Δένδρα Απόφασης

Page 9: Drug design

10

/04

/20

23

9

ΑΛΓΟΡΙΘΜΟΙ ΜΜ [1/2]

Μέθοδος μάθησης που αποθηκεύει στη μνήμη το σύνολο των αντικειμένων της εκπαίδευσης.

Υπολογίζεται ένα μοντέλο παρεμβολής βασισμένο στη γειτονιά του αντικειμένου πρόβλεψης .

Αλγόριθμος κ-πλησιέστερων γειτόνων βασίζεται :

- χώρο περιγραφέα (σύνολο περιγραφέων που αξιολογείται σε μια μελέτη ή σε ένα υποσύνολο που δίνει καλύτερες προβλέψεις)

- απόσταση - γειτονιά κ του αντικειμένου πρόβλεψης.

Αναβλητική Μάθηση - kNN

Page 10: Drug design

10

/04

/20

23

10

ΑΛΓΟΡΙΘΜΟΙ ΜΜ [2/2]

Ταξινόμηση κ-κοντινότερων γειτόνων (a) - Προσδιορισμός κοντινότερου γείτονα. - Η κατηγορία που ανήκει το αντικείμενο πρόβλεψης είναι η κατηγορία με

την πλειοψηφία των γειτόνων του η -1 αν κ=3, και η + 1 αν κ=5 - Η βέλτιστη τιμή του κ καθορίζεται συνήθως από τη διασταύρωση (cross-

validation).  Παλινδρόμηση κ-κοντινότερων γειτόνων (b) - Κάθε αντικείμενο εκπαίδευσης έχει για ιδιότητα έναν πραγματικό

αριθμό - Η προβλεπόμενη ιδιότητα για το άγνωστο αντικείμενο είναι ο μέσος

όρος της αξίας της ιδιότητας για k κοντινότερους γείτονές του - Η προβλεπόμενη τιμή για το κ=3 είναι (6+6+7) / 3 = 6.3, ενώ η

πρόβλεψη για κ=5 είναι 5.6.

Αναβλητική Μάθηση - kNN

Page 11: Drug design

10

/04

/20

23

11

ΑΛΓΟΡΙΘΜΟΙ ΜΜ [3/4]

Αν και εφαρμόστηκε πολύ πρόσφατα στη σχεδίαση φαρμάκων, έχει αρκετά χαρακτηριστικά που την καθιστούν ιδιαίτερα χρήσιμη.

Οι ταξινομητές Bayes δίνουν ανεξάρτητες προβλέψεις, ανέχονται το θόρυβο και τα λάθη στα πειραματικά δεδομένα και μπορούν να «τρέξουν» γρήγορα σε σχέση με άλλους αλγορίθμους ΜΜ.

Αξιολογούν μια ομάδα περιγραφέων δομών, για να προβλέψουν τη δραστηριότητα μιας χημικής ουσίας, βασισμένοι στους γνωστούς περιγραφείς και τις δραστηριότητες του συνόλου των δεδομένων εκπαίδευσης

Η εικονική οπτικοποίηση των μεγάλων χημικών βιβλιοθηκών είναι μια τεράστια εφαρμογή των ταξινομητών Bayes, κυρίως εξαιτίας της ανοχής τους στο θόρυβο των πειραματικών δεδομένων

Μάθηση κατά Bayes

Page 12: Drug design

10

/04

/20

23

12

ΑΛΓΟΡΙΘΜΟΙ ΜΜ [4/4]

Η ιδέα πίσω από τα SVM είναι ότι δοσμένης μιας σειράς υποθέσεων αυξανόμενης πολυπλοκότητας, επιλέγουν αυτή που ελαχιστοποιεί το σφάλμα εκπαίδευσης και ταυτόχρονα αυτή που ελαχιστοποιεί ένα ανώτατο όριο σφάλματος γενίκευσης.

Αυτό το πετυχαίνουν ελέγχοντας το μέγεθος τωνβαρών των χαρακτηριστικών.

Είναι μια μέθοδος ΜΜ για δυαδικά προβλήματαταξινόμησης, με εύκολη εκπαίδευση, καλή απόδοσηκαι χαμηλό κόστος.

Προβάλλουν τα σημεία του συνόλου εκπαίδευσης σεέναν χώρο περισσοτέρων διαστάσεων και βρίσκουν τουπερεπίπεδο το οποίο διαχωρίζει βέλτιστα τα σημείατων δύο τάξεων. Τα άγνωστα σημεία ταξινομούνταισύμφωνα με την πλευρά του υπερεπίπεδου στην οποίαβρίσκονται.

Τα διανύσματα τα οποία ορίζουν το υπερεπίπεδο το οποίο χωρίζει τις δύο τάξεις ονομάζονται διανύσματα υποστήριξης (support vectors).

Βρήκε γρήγορα πολλές εφαρμογές στη χημεία, τη βιοχημεία και Φαρμακοχημεία.

Μηχανές Διανυσμάτων Υποστήριξης - SVMs

Page 13: Drug design

10

/04

/20

23

13

ΕΦΑΡΜΟΓΕΣ Η πρωτοβουλία WISDOM (World-wide In Silico Docking on Malaria) συνδράμει

στην καταπολέμηση ασθενειών, καθορίζοντας πόσο καλά κάποια φάρμακα επικολλώνται σε συγκεκριμένα μέρη του ιού (μαλάρια, γρίπη των πτηνών) wisdom.healthgrid.org

Το GridGRAMM αποτελεί μια απλή διεπαφή για μοριακό ελλιμενισμό στο διαδίκτυο, που μπορεί να χρησιμοποιηθεί για μελέτη της αλληλεπίδρασης των μορίων, ώστε να οδηγήσει σε σχεδιασμό φαρμάκων και κατανόηση της συμπεριφοράς νοσηρών μεταλλάξεων http://www.es.embnet.org/Services/MolBio/WebGRAMM/

Στόχος του GROCK (Grid Dock) είναι να παρέχει έναν εύκολο τρόπο διεξαγωγής της μαζικής συμπεριφοράς μοριακών αλληλεπιδράσεων μέσω του διαδικτύου επιτρέποντας στους χρήστες να συγκρίνουν ένα μόριο απέναντι σε μια ολόκληρη βάση πληροφοριών άλλων γνωστών δομών.

Το έργο Virtual Laboratory ασχολείται με την έρευνα, το σχεδιασμό και την ανάπτυξη τεχνολογιών πλέγματος, που βοηθούν στην επίλυση μεγάλης κλίμακας υπολογισμών και στην εντατική επεξεργασία μοριακών δεδομένων http://www.buyya.com/vlab/

To Torsade de point (TdP) είναι μια δυσμενής αντίδραση στα φάρμακα, μια άτυπη κοιλιακή ταχυκαρδία. Η ΜΜ βοηθά στην αναγνώριση των φαρμάκων που περιέχουν TdP από αυτά που δεν περιέχουν

Page 14: Drug design

10

/04

/20

23

14

ΜΕΛΛΟΝΤΙΚΕΣ ΚΑΤΕΥΘΥΝΣΕΙΣ Οι πρόσφατες δημοσιεύσεις εξερευνούν μια πολύ μεγαλύτερη

ποικιλία στατιστικών μοντέλων με την πρόθεση να βοηθήσουν τη διαδικασία ανακάλυψης φαρμάκων με αξιόπιστες προβλέψεις.

Φαίνεται πως δεν είναι δυνατόν να προβλεφθεί ποιος συνδυασμός περιγραφέων και ΜΜ θα δώσει τις πιο αξιόπιστες προβλέψεις για καινοτόμες χημικές ουσίες.

Έτσι, θα πρέπει να γίνεται σύγκριση πολλών τύπων περιγραφέων και τόσων αλγορίθμων ΜΜ όσων είναι υπολογιστικά δυνατόν,

Να υπάρχει καλό πλάνο για τα πειράματα, με κατάλληλη επικύρωση, και

Μια αντικειμενική και κατανοητή αξιολόγηση των αλγορίθμων ΜΜ.

Εξαιτίας της πολυπλοκότητας των βιολογικών συστημάτων, οι μέθοδοι ΜΜ θα είναι απαραίτητες για τη μελλοντική ανακάλυψη φαρμάκων. Συγκεκριμένα, οι μέθοδοι μηχανικής όρασης που εξάγουν λεπτομερείς πληροφορίες από απεικονιστικές αναλύσεις, και οι μέθοδοι ενεργούς μάθησης που καθοδηγούν τον πειραματισμό, θα είναι αναγκαίες για να ξεπεραστεί το πρόβλημα της διαστατικότητας στην ανάπτυξη φαρμάκων.

Page 15: Drug design

10

/04

/20

23

15

3D ΕΝΤΥΠΗ ΜΟΡΦΗ ΜΟΝΤΕΛΟΥ ΕΝΟΣ ΜΟΡΙΟΥ

Ο σχεδιασμός φαρμάκων είναι ένα επιστημονικό πρόβλημα τόσο σημαντικό ώστε οι ερευνητές είναι πρόθυμοι να αναπτύξουν οποιαδήποτε προσέγγιση δημιουργικής επίλυσης προβλημάτων, συμπεριλαμβανομένης και τεχνολογίας-κλισέ όπως gamification και επαυξημένη πραγματικότητα. Η τελευταία προσέγγιση είναι η χρήση 3D εκτυπωτών για την εξαγωγή μοντέλων των φαρμάκων και ενζύμων, και η απόδοση σε αυτά ετικετών επαυξημένης πραγματικότητας, έτσι ώστε η υπολογιστική όραση να βοηθήσει τους ερευνητές να βρουν τη βέλτιστη εφαρμογή.

Page 16: Drug design

10

/04

/20

23

16

ΣΑΣ ΕΥΧΑΡΙΣΤΟΥΜΕ ΓΙΑ ΤΗΝ ΠΡΟΣΟΧΗ ΣΑΣ!