UNIVERSITATEAPOLITEHNICA TIMIŞOARA
UNIVERSITATEAPOLITEHNICA TIMIŞOARA
MASTER SIIS MASTER SIIS
Sisteme Informatice în Îngrijirea Sisteme Informatice în Îngrijirea Sănătății Sănătății
1
www.medinfo.umft.ro/www.medinfo.umft.ro/dimdim/bioinformatica.htm/bioinformatica.htm
2
BIOINFORMATICABIOINFORMATICA
Prof Dr George I MihalaProf Dr George I Mihalaşş
UMF Victor BabeşUMF Victor Babeş
3
CURSUL 6CURSUL 6
4
ANALIZA SECVENŢIALĂANALIZA SECVENŢIALĂ• Analiza unei secvenţe• Compararea a două secvenţe
– Metode simple: Dot Plots și Distanțe
– Programare dinamică• Aliniere globală
• Aliniere locală
– Modele complexe
• Matrici de substituție– Pentru Proteine
– Pentru Acizi nucleici
• Alinierea multiplă
5
ANALIZA ANALIZA SECVENSECVENȚELORȚELORINDIVIDUALINDIVIDUALEE
6
Analiza secvenAnaliza secvenţelor individualeţelor individuale• AA au proprietăţi diferite:
– Reziduu (catena laterală) hidrofil / hidrofob
– Sarcina electrică, dimensiune, felexibilitate
• Relaţii între proprietăţi (Nishikawa)• Consecinţe (ex)
– AA hidrofobi: • în interiorul proteinelor globulare
• în proteine transmembranare
– AA hidrofili – la suprafaţă
– Periodicităţi – elice, Alternanţe – fâşii
– Predicţie epitopi antigenici
• Grafice: scări numerice, ferestre de mediere (9-15 AA)7
8
• Proprietăţi în 3D– Glu în alfa-helix
– Pro şi Tyr în beta-strips
• Elice amfipatice (coiled-coil)– O parte hidrofilă, una hidrofobă
– Succesiune (3-6 grupe) de 7 AA• Heptade
• Fermoare de leucină– “Leucine zipper”
– Domenii ce se leagă de ADN în proteinele reglatoare (factori de transcriere)
9
10
COMPARAREA COMPARAREA A A DOUDOUĂ SECVENȚE (I)Ă SECVENȚE (I)
““Dot Plots” și DistanțeDot Plots” și Distanțe
11
Compararea a două secvenţe“Pairwise alignement”
• Evenimente• Termeni• Scop şi mijloace
– daca două secvenţe sunt corelate
– ce fel de “aliniere” poate fi considerată
– sisteme de scoruri pentru ierarhizarea alinierilor
– algoritmi pentru alinierea “optimă”
– metode statistice de evaluare a semnificaţiei scorului
• Exemple
12
• Evenimente– Substituţii– Inserţii şi Deleţii (InDel); “gaps”
• Termeni – compararea a 2 secvenţe– HOMOLOG
• 2 organisme diferite, ancestor comun
– ORTOLOG• diferenţe datorită speciaţiei• se reţine funcţionalitatea în evoluţie
– PARALOG• în 1 organism, evenimente la duplicare
– XENOLOG• nu au aceeaşi origine prin evoluţie• apar prin evenimente “orizontale” (simbioză, viruşi etc)
• SIMILARITATE ≠ HOMOLOGIE13
Alinierea vizuală – DOT PLOTS (i)Alinierea vizuală – DOT PLOTS (i)
• Matrice – cele 2 secvenţe pe axe
• Marcarea identităţilor
• Obs – “zgomote”, introducere “ferestre” de 2, 3 etc
14
Alinierea vizuală – DOT PLOTSAlinierea vizuală – DOT PLOTS (ii) (ii)
Cu “fereastră” de 2
15
Results for aligning ACCTGAGCTCACCTGAGTTAACCTGAGCTCACCTGAGTTA to itself using the Dot Matrix option of the AlignX feature of
Informax’s Vector NTI program
16
Evidenţiere inserţii/deleţii, repetări, inversiuniObs: introni / exoni
17
Comparare secvenţe cromozomiale (ex. cromozomul 5 şi Y)
18
Măsurarea similarităţiiMăsurarea similarităţii
DH1 = 1 DH2 = 3, DL2 = 7x2 – 1x1 – 2x2 = 9
DL3 = 6 DL4 = 6
S3 = 5x2 – 4x1 – 2x2 = 2 S3 = 5x5 – 4x3 – 2x4 = 5
S4 = 6x2 – 2x1 – 4x2 = 2 S4 = 6x5 – 2x3 – 4x4 = 8
• Distanţe:
D = nr.nepotriviri
- Hamming - 2 secv.egale (n)
- Levenshtein (‘edit’ distance) – incl. gaps = nr.’editări’…
• Scheme de scor
a) Potrivire = +2
Nepotrivire = -1
Gap (Indel) = -2
b) +5 / -3 / -4
19
Secvenţe de nucleotide in ADNSecvenţe de nucleotide in ADN
20
ExemplulExemplul 2 2
21
PAUZAPAUZA
22