Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ...

Preview:

DESCRIPTION

Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ ηχανικών και Μ ηχανικών Υ πολογιστών Τ ομέας Τ εχνολογίας Π ληροφορικής και Υ πολογιστών. Διπλωματική Εργασία DIANA 2.0: Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών Φωτοπούλου Χ. Γεωργία Επίβλεψη: Τιμολέων Σελλής - PowerPoint PPT Presentation

Citation preview

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟΣχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών ΥπολογιστώνΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστών

Διπλωματική Εργασία

DIANA 2.0: Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών

Φωτοπούλου Χ. Γεωργία

Επίβλεψη: Τιμολέων Σελλής

12 Ιουλίου 2010

Φωτοπούλου Γεωργία 1

Υπόβαρθο

DNA

Φωτοπούλου Γεωργία 1

Υπόβαρθο

DNA

mRNA

Φωτοπούλου Γεωργία 1

Υπόβαρθο

DNA

mRNA

πρωτεϊνη

Φωτοπούλου Γεωργία 1

Υπόβαρθο

DNA

mRNA

πρωτεϊνη

γονίδιο ↔ mRNA

Φωτοπούλου Γεωργία 2

Υπόβαρθο

microRNA

στόχοι

πειραματικές και υπολογιστές τεχνικές

Ε.Κ. Βιοϊατρικών Επιστημών “Αλέξανδρος Φλέμινγκ”

Φωτοπούλου Γεωργία 3

Αρχιτεκτονική

Φωτοπούλου Γεωργία 4

Αποφάσεις

Ανάλυση απαιτήσεων → Περιπτώσεις χρήσης

Σχεδιασμός → Model-View-Controller (MVC)

Yλοποίηση → Apache+MySQL+PHP+Yii

Αξιολόγηση/Έλεγχος → Σενάρια εκτέλεσης

Φωτοπούλου Γεωργία 5

Χαρακτηριστικά DIANA 2.0

Αναζήτηση βιολογικών στόχων

Παροχή προτάσεων σε λανθασμένους όρους

Προβολή στόχων με βάση άλλους αλγορίθμους

Περιβάλλον διαχείρισης χρηστών

Φωτοπούλου Γεωργία 6

Αναζήτηση βιολογικών στόχων Υποστήριξη όρων διαφόρων τύπων

- όνομα microRNAπχ “hsa-let-7e”

- κωδικός ΜΙΜΑ microRNAπχ “ΜΙΜΑΤ0000062” ή “MI0000401”

- όνομα γονιδίου πχ “FIGN”

- κωδικός ENSEMBL γονιδίουπχ ENSG00000000005 ή ENSMUSG00000070000

- κωδικός TRANSCRIPT γονιδίουπχ ENST00000400000 ή ENSMUST00000020000

- κωδικός Refseq γονιδίουπχ XM_905004 ή XR_002000 ή NM_012001 ή NR_000003

Απλοποίηση

Φωτοπούλου Γεωργία 7

Παροχή προτάσεων Εξοικονομεί μνήμη και χρόνο

Μαντεύει

Εκμεταλλεύεται τη δομή των όρων

Χρησιμοποιεί συντακτική απόσταση LevenshteinL(seq1,seq2) = #delete + #insert + #substitution

πχ L (foo, fo) = 1 → 1 deleteL (hat, cat) = 1 → 1 substitution L (beta, res) = 3 → 1 insert, 2 substitutions

Φωτοπούλου Γεωργία 8

tokenizationπχ hsa-let-100g → 4 tokens

db-tokens

hsa → Ναι let → Ναι 100 → Ναι g → Όχι

Παροχή προτάσεων – microRNA ονόματα

Φωτοπούλου Γεωργία 8

tokenizationπχ hsa-let-100g → 4 tokens

db-tokens

hsa → Ναι let → Ναι 100 → Ναι g → Όχι

Παροχή προτάσεων – microRNA ονόματα

Φωτοπούλου Γεωργία 9

ranking

Λίστα “Ναι”: σκορ εμφάνισης

[(hsa-let-7i → 2), (hsa-mir-95 → 1), (mmu-mir-100 → 1)]

Λίστα “Όχι”: απόσταση levenshtein

[(hsa-let-7i → 1)]

normalization

Λίστα “Ναι” : (item / #tokens)*0.5

[(hsa-let-7i → 0.25), (hsa-mir-95 → 0.125), (mmu-mir-100 → 0.125)]

Λίστα “Όχι”: (item / min_levenshtein) * 0.5]

[(hsa-let-7i → 0.5)]

Παροχή προτάσεων – microRNA ονόματα

Φωτοπούλου Γεωργία 10

merge

merged_list = [(hsa-let-7i → 0.75),(hsa-mir-95 → 0.125),(mmu-mir-100 → 0.125)]

suggest top-k terms

για k=2:- hsa-let-7i- hsa-mir-95

Παροχή προτάσεων – microRNA ονόματα

Φωτοπούλου Γεωργία 11

βασική μορφή- Κωδικός ΜΙΜΑ: ΜΙΜΑΤ ή ΜΙ + 7 ψηφία - Κωδικός ENSEMBL: ΕNSG ή ENSMUSG + 11 ψηφία - Κωδικός TRANSCRIPT: ENST ή ENSMUST + 11 ψηφία- Κωδικός Refseq: XM_ ή XR_ ή ΝΜ_ ή NR_ + ψηφία

tokenization - πχ ΜΙΜΑΤ0087 → MIMAT και 0087

σταθεροποίηση αριθμού ψηφίων- πχ 0087 → 0000087- πχ 00000000087 → 0000087

levenshtein -πχ 0000087 → 0000097, 0000017, 0000117 κοκ

concatenation0087 → ΜΙΜΑΤ0000097, ΜΙΜΑΤ0000017, ΜΙΜΑΤ0000117

Παροχή προτάσεων – κωδικοί

Φωτοπούλου Γεωργία 12

τελική περίπτωση

levenshtein

Παροχή προτάσεων – όνομα γονιδίου

Φωτοπούλου Γεωργία 13

Εμφάνιση κατάλληλου συνδέσμου στη λίστα αποτελεσμάτων

Δεν υποστηριζόταν στην προηγούμενη έκδοση

Προβολή στόχων άλλων αλγορίθμων

Φωτοπούλου Γεωργία 14

Προβολή λίστας χρηστών Τροποποίηση στοιχείων χρήστη

Διαγραφή χρήστη

Πρόσθεση νέου χρήστη

Ανέβασμα αρχείων στόχων

Περιβάλλον διαχείρισης

Φωτοπούλου Γεωργία 15

Εύχρηστο περιβάλλον διαχείρισης

Απλοποιημένος μηχανισμός αναζητήσεων

Βελτιωμένος μηχανισμός παροχής προτάσεων

Συγκριτική παρουσίαση προβλέψεων με βάση άλλους αλγορίθμους

Διευκόλυνση μελλοντικών επεκτάσεων λόγω τεκμηρίωσης

Συνεισφορά

Φωτοπούλου Γεωργία 16

Ακολουθεί επίδειξη της εφαρμογής DIANA 2.0 ...

Φωτοπούλου Γεωργία 17

Ερωτήσεις;

Φωτοπούλου Γεωργία 18

Ευχαριστώ!

Recommended