61
STRUKTŪRINĖ IR STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, FUNKCINĖ GENOMIKA, PROTEOMIKA IR PROTEOMIKA IR BIOINFORMATIKA BIOINFORMATIKA

STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

  • Upload
    ham

  • View
    169

  • Download
    0

Embed Size (px)

DESCRIPTION

STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA. ĮVADAS. G enomi ka y r a rūšies viso genomo molekulinė analizė Genom o analizę sudaro dvi pagrindinės fazės Genolapio sudarymas Se kvenavimas (nukleotidų sekos nustatymas) - PowerPoint PPT Presentation

Citation preview

Page 1: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

STRUKTŪRINĖ IR STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, FUNKCINĖ GENOMIKA,

PROTEOMIKA IR PROTEOMIKA IR BIOINFORMATIKABIOINFORMATIKA

Page 2: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

ĮVADAS

Genomika yra rūšies viso genomo molekulinė analizė Genomo analizę sudaro dvi pagrindinės fazės

Genolapio sudarymas Sekvenavimas (nukleotidų sekos nustatymas)

1995 m. mokslininkai vadovaujami Craigo Venterio ir Hamiltono Smitho nustatė pirmojo organizmo pilną DNR seką Tai buvo bakterija Haemophilus influenzae

10-2

Page 3: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-3

Bakterijos Haemophilus influenzae pilnas genolapis

1.83 milijonų bp

~ 1,743 genų

Page 4: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

1996 m. buvo pabaigtas pirmojo eukariotinio organizmo genomo tyrimas. Jį atliko pasaulinis mokslininkų konsorciumas, vadovaujamas Andre Goffeau iš Belgijos

Saccharomyces cerevisiae Genomą sudaro 16 linijiškų chromosomų

~ 12 milijonų bp, ~ 6,200 genų Vėliau buvo sekvenuoti kitų organizmų genomai, įskaitant

žmogų

Struktūrinė genomika prasideda genolapio sudarymu ir baigiasi pilnu genomo sekvenavimu

Funkcinė genomika tiria, kaip genų sąveikos skuria organizmo požymius

Funcinės genomikos pagrindinė paskirtis yra išsiaiškinti genetinių sekų reikšmę organizmo funkcionavimui

Daugeliu atvejų tai leidžia suprasti geno funkciją

10-4

Page 5: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Pilnas rinkinys baltymų, kuriuos gali sintetinti organizmas, yra vadinamas proteomu

Proteomika yra visų genomo koduojamų baltymų ir jų sąveikų tyrimas

Proteomikos tikslas yra išsiaiškinti organizmo baltymų funkcinę paskirtį Taip pat ji siekia ištirti baltymų sąveikas

Bioinformatikos tikslas yra perskaityti informaciją, esančią genetinėse sekose, naudojant matematinius/kompiuterinius metodus

10-5

Page 6: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

DNR sričių struktūrinė organizacija paprastai nustatoma trimis būdais

1. Citogenetinis (geno)kartografavimas Remiasi mikroskopine analize Genai siejami su chromosomų ruožais

2. Sankibos (geno)kartografavimas Remiasi kryžminimais Nustatoma genų padėtis vienas kito atžvilgiu

Atstumai matuojami genolapio vienetais (arba centimorganais)

3. Fizinis (geno)kartografavimas Remiasi DNR klonavimo metodais Nustatoma genų padėtis vienas kito atžvilgiu

Atstumai matuojami bazių poromis

10.1 STRUKTŪRINĖ GENOMIKA

10-6

Page 7: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Citogenetinis kartografavimas remiasi mikroskopija Dažniausiai naudojamas tiriant eukariotus, turinčius dideles

chromosomas

Eukariotų chromosomas galima atskirti pagal Dydį Centromeros padėtį Ruožuotumą

Ruožuotumas išryškėja chromosomas nudažius specifiniais dažais Jis naudojamas genų kartografavimui

Citogenetinis (geno)kartografavimas

10-7

Page 8: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Darant citogenetinį kartografavimą yra bandoma nustatyti genų išsidėstymą specifinių chromosomos ruožų atžvilgiu Dažniausiai tai yra augalų ir gyvūnų genų lokalizacijos

nustatymo pirmasis etapas

Citogenetinis kartografavimas remiasi mikroskopija Todėl jo skiriamoji geba yra gana limituota

Daugelio rūšių atveju ji yra ~ 5 milijonus bp

Skiriamoji geba daug geresnė toms rūšims, kurios turi politenines chromosomas

Pvz., Drosophila melanogaster

10-8

Page 9: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Hibridizacija in situ padeda nustatyti geno padėtį intaktinėse chromosomose Ji naudojama nustatyti genų ar DNR sekų lokalizaciją

didelėse eukariotų chromosomose

Naudojami zondai, padedantys aptikti ieškomas DNR sekas (“taikinį”)

Dažniausiai naudojami fluorescenciniais dažais pažymėti DNR zondai Šis metodas vadinamas fluorescencine in situ hibridizacija

(FISH)

Hibridizacija in situ

10-9

Page 10: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-10Fluorescencinės in situ hibridizacijos (FISH) metodas

Ląstelės veikiamos medžiagomis, fiksuojančiomis jas ant stikliuko

DNR zondai yra chemiškai modifikuoti taip, kad prie jų

gali prisijungti fluorescuojanti žymė

Page 11: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Fluorescencinių zondų skleidžiamai šviesai aptikti yra naudojami fluorescenciniai mikroskopai Fluorescuojantis zondas yra matomas kaip

švytinti sritis nešvytinčiame fone Zondai prisitvirtina tik prie specifinių sekų

FISH eksperimentų rezultatai yra lyginami su Giemsa dažais nudažytų chromosomų vaizdu Zondo padėtis gali būti nusakoma G ruožų

atžvilgiu

10-11

Page 12: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-12

Page 13: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-13

Page 14: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Sankibos kartografavimas remiasi rekombinantinių palikuonių dažnio skaičiavimu Visi genai, esantys vienoje chromosomoje, yra paveldmi

kartu sukibę, t.y. sudaro vieną sankibos grupę Jei įvyksta krosingoveris, gali pasikeisti sukibusių genų seka Krosingoverio dažnis tuo mažesnis, kuo arčiau vienas kito

yra sukibę genai

Gali būti sudaromi ne genų, o genetinių žymenų genolapiai. Molekulinis žymuo yra DNR fragmentas, kuris randamas specifinėje chromosomos vietoje ir gali būti specifiškai atpažintas Kaip ir alelių atveju, molekulinių žymenų ypatybės gali skirtis

tarp skirtingų individų

Sankibos (geno)kartografavimas

10-14

Page 15: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Restrikcijos fermentai atpažįsta specifines DNR sekas ir jose kerpa DNR

Ilgose chromosomose gali būti daug vietų, kurias atpažįsta ir kerpa restrikcijos fermentai Jos yra pasiskirstę atsitiktinai Lyginant du individus galima aptikti tokių

atpažinimo vietų kiekio ir/ar išsidėstymo skirtumus

Restrikcijos fragmentų ilgio polimorfizmas (RFLP)

10-15

Page 16: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-16

Page 17: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-17

Page 18: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-18Restrikcijos fragmentų ilgio polimorfizmas (RFLP)

Restrikcijos vieta, randama tik 1-ame individe

Populiacijoje stebimas DNR fragmentų ilgio polimorfizmas

Ši variacija gali atsirasti dėl delecijų, duplikacijų, genų mutacijų

ir t.t.

Rodyklės rodo restriktazių kirpimo vietas

Page 19: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Trijų individų chromosominės DNR RFLP analizė

EcoRI kirpimo vietos yra abiejose

chromosomose

10-19

EcoRI kirpimo vietų nėra abiejose

chromosomose

Page 20: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-20

EcoRI kirpimo vieta yra tik vienoje chromosomoje

Trys individai turi daug bendrų vienodo ilgio DNR

fragmentų

Jei šie fragmentai randami 99% visų populiacijos individų, jie vadinami

monomorfiniais

Polimorfinės juostos pažymėtos strėlėmis

Page 21: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

RFLP sankibos analizė gali būti atlikta su daugeliu RFLP žymenų, nustatant jų santykinę padėtį genome

Genolapis, sudarytas iš daugelio RFLP žymenų, vadinamas RFLP genolapiu RFLP genolapiai naudojami genų padėčiai

nustatyti tam tikroje chromosomoje

RFLP genolapiai

10-21

Page 22: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-22

Kairiojoje pusėje nurodyta

RFLP žymenų išsidėstymas

Dešiniojoje pusėje nurodyti

genetiniai atstumai

Keletas žinomų genų

pažymėti raudonai

Supaprastintas augalo Arabidopsis thaliana RFLP genolapis

Page 23: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Fiziniam kartografavimui atlikti reikia klonuoti daugelį chromosominės DNR fragmentų

Klonuoti DNR fragmentai yra apibūdinami pagal 1. Dydį 2. Turimus genus 3. Padėtį chromosomoje

Pastaraisiais metais naudojant fizinį kartografavimą sekvenuoti ištisi genomai

Fizinis (geno)kartografavimas

10-23

Page 24: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-24

Page 25: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Atliekamas plataus masto genomų sekvenavimas leidžia tyrinėti genų veiklą daug sudėtingesniame lygmenyje Dabar galima vienu metu tirti daugelio genų grupių

veiklą Vienas iš pagrindinių genominių tyrimų tikslų

yra nustatyti tas DNR sritis, kuriose iš tiesų yra genų Vienas būdų tai padaryti yra parodyti, kad tiriama

sritis yra transkribuojama į RNR

10.2 FUNKCINĖ GENOMIKA

10-25

Page 26: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Tai padaroma sukuriant cDNA biblioteką cDNR (copy DNA) yra gaunama atvirkštinės transkriptazės pagalba

susintetinus DNR nuo mRNR, išskirtos iš ląstelės cDNR biblioteka taip pat vadinama EST biblioteka (expressed

sequence tag library) Šios sekos taip pat gali būti naudojamos kaip žymenys, atliekant fizinį

chromosomų kartografimą EST bibliotekoje esančios sekos gali būti sekvenuotos ir

vėliau palygintos su genomo sekomis Atitikimai rodo, kurios genomo vietos koduoja genus

cDNR bibliotekos sukūrimas padeda tirti genų reguliaciją genomo lygmenyje

Tokių tyrimų strategija yra išskirti mRNR esant skirtingoms ląstelės ar organizmo funkcionavimo sąlygoms

Tada galima nustatyti tas mRNR, kurios yra sintetinamos tik esant vienokioms ar kitokioms sąlygoms

Genų ekspresija gali būti nustatyta cDNR bibliotekoje

10-26

Page 27: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Sukurtas naujas tyrimo metodas, vadinamas DNR mikrogardelėmis (taip pat vadinama genų lustais) Šis naujas metodas leidžia vienu metu tirti tūkstančių genų

veiklą

DNR mikrogardelė yra maža silicio, stilo ar plastiko plokštelė, padengta daugelio DNR sekų taškeliais Kiekviena iš šių sekų atitinka vieną žinomą geną

Šios sekos veikia kaip zondai, aptinkantys transkribuojamus genus

10-27

Mikrogardelės gali nustatyti transkribuojamus genus

Page 28: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Šie DNR fragmentai gali būti Amplifkuoti PGR pagalba ir vėliau pritvirtinti ant

mikrogardelės Tiesiogiai susintetinti ant mikrogardelės Viena mikrogardelė turi dešimtis tūkstančių skirtingų taškų,

o jos dydis neviršia pašto ženklo Kiekvieno taško (su skirtingo geno DNR) padėtis gardelėje yra

tiksliai žinoma

DNR mikrogradelių gamybos technologija yra gana įdomi ir primena technologiją, kuri naudojama rašaliniuose spausdintuvuose

Pagamintos DNR mikrogardelės naudojamos hibridizacijai su cDNR, susintetinta atvirkštinės transkriptazės pagalba nuo iš ląstelės išskirtų mRNR

10-28

Page 29: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-29

Mikrogardelė nuplaunama

Po to ji tiriama skenuojančiu konfokaliniu fluorescenciniu mikroskopu

Tiriama fluorescuojančios vietos, kurios rodo įvykusią hibridizaciją

Page 30: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-30

Page 31: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

DNR mikrogardelių panaudojimas

Panaudojimas Aprašymas

Specifinėms ląstelėms būdingos genų ekspresijos tyrimai

Lyginant cDNR, gautas iš skirtingų tipų ląstelių, galima nustatyti genus, kurių ekspresija vyksta tik tam tikrose ląstelėse ar audiniuose

Genų reguliacijos tyrimai Galima tirti kintančių aplinkos sąlygų įtaką genų ekspresijai

Metabolizmo kelių tyrimai

Galima tirti visų genų, dalyvaujančių viename ar kitame metabolizmo kelyje, ekspresiją

Vėžinių ląstelių tyrimai Skirtingų tipų vėžinių ląstelių genų ekspresija labai skiriasi. DNR mikrogardeles galima naudoti klasifikacijai navikų, kurie morfologiškai nesiskiria

Genetinio kintamumo tyrimai

Mutantinis alelis gali hibridizuotis su mikrogardele prasčiau, negu laukinio tipo alelis

Mikroorganizmų kamienų identifikacija

Mikrogardelių pagalba galima atskirti giminiškų bakterijų rūšis ar porūšius

10-31

Page 32: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Proteomika tiria organizmo gaminamų baltymų funkcinę paskirtį Pilnas rūšies baltymų rinkinys yra vadinamas proteomu

Genomikos duomenys gali suteikti svarbių žinių apie proteomą 1. DNR mikrogardelės parodo genus, kurie yra

transkribuojami esant tam tikroms sąlygoms 2. Skirtingų rūšių genų homologijos tyrimai gali būti

panaudojami baltymų struktūrai ar funkcijai nuspėti

Tačiau genominius tyrimus turi sekti tiesioginiai pačių baltymų tyrimai

10.3 PROTEOMIKA

10-32

Page 33: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Viso genomo sekvenavimas ir analizė gali padėti nustatyti visus rūšies genus

Tačiau proteomas yra didesnis už genomą ir tikrąjį jo dydį sunku nustatyti Taip įvyksta dėl keletos procesų

1. Alternatyvaus splaisingo 2. RNR redagavimo 3. Potransliacinės kovalentinės modifikacijos

10-33

Proteomas yra žymiai didesnis už genomą

Page 34: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

1. Alternatyvus splaisingas Svarbiausias pokytis, atsiradęs eukariotuose Viena pre-mRNR yra pertvarkoma į keletą skirtingų mRNR Splaisingas dažnai yra specifiškas tam tikroms ląstelėms arba tam

tikroms aplinkos sąlygoms 2. RNR redagavimas

Sutinkamas rečiau už alternatyvų splaisingą Pakeičia koduojančią mRNR seką

3. Potransliacinė kovalentinė modifikacija Funkcionaliam baltymui sukurti gali būti reikalingos negrįžtamos

modifikacijos Proteolitinis procesingas; prostetinių grupių, cukrų ar lipidų prisijungimas

Grįžtami pokyčiai gali trumpam pakeisti baltymo funkcijas Fosforilinimas; metilinimas

Visi šie procesai padidina potencialių baltymų kiekį proteome

10-34

Page 35: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Yra kuriamos ir baltymų mikrogardelės

Baltymų mikrogardelių kūrimas yra sudėtingesnis procesas 1. Baltymus žymiai lengviau pažeisti, atliekant įvairias

manipuliacijas, reikalingas mikrogardelei pagaminti 2. Baltymų sintezė ir išgryninimas reikalauja daug daugiau

laiko, lyginant su DNR

Nepaisant to, pastaraisiais metais yra pasiektas tam tikras progresas baltymų mikrogardelių kūrime ir panaudojime proteomikos tyrimuose

10-35

Baltymų mikrogardelės

Page 36: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Baltymų mikrogardelių panaudojimas

Panaudojimas Aprašymas

Baltymų ekspresijos tyrimai

Antikūnų mikrogardelės pagalba galima tirti baltymų ekspresiją, nes kiekvienas antikūnas, esantis mikrogardelės taške, atpažįsta specifinę aminorūgščių seką

Baltymų funkcijos tyrimai

Grupės baltymų substratinis specifiškumas ir fermentinis aktyvumas gali būti tiriami veikiant mikrogardelę skirtingais substratais

Baltymų sąveikos su baltymais tyrimai

Dviejų baltymų gebėjimas sąveikauti gali būti tiriamas veikiant mikrogardelę fluorochromu pažymėtais baltymais

Farmakologiniai tyrimai

Vaistų gebėjimas susijungti su ląstelės baltymais gali būti tiriamas veikiant mikrogardelę įvairiais pažymėtais vaistais

10-36

Page 37: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Yra du pagrindiniai baltymų mikrogardelių tipai 1. Antikūnų mikrogardelės 2. Funkcinės mikrogardelės

Antikūnų mikrogardelės Sudarytos iš rinkinio antikūnų, atpažįstančių

trumpas peptidų sekas Naudojamos įvertinti baltymų ekspresijos laipsniui

Funkcinės mikrogardelės Sudarytos iš daugelio skirtingų ląstelės baltymų Naudojamos baltymų funkcijoms tirti

10-37

Page 38: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Kompiuteris tapo svarbiu genetinių tyrimų instrumentu Genetikos ir informatikos mokslų sandūroje

susikūrė nauja mokslo šaka - bioinformatika

Genetinių sekų kompiuterinei analizei paprastai reikia trijų pagrindinių elementų: Kompiuterio Kompiuterinių programų Genetinių duomenų

10.4 BIOINFORMATIKA

10-38

Page 39: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Kompiuterinė programa yra apibrėžta operacijų seka, kuri gali analizuoti duomenis pasirinktu būdu

Pirmasis kompiuterinės genetinių duomenų analizės etapas yra kompiuterinių duomenų bylos sukūrimas Ši byla yra informacijos rinkinys, tinkamas saugoti ir

manipuliuoti kompiuteryje Pavyzdžiui, bylą gali sudaryti lacY geno iš E. coli DNR

seka

10-39

Sekos analizuojamos naudojant kompiuterines programas

Page 40: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-40

Skaičiai rodo bazės numerį sekos byloje

Page 41: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Duomenų suvedimas į kompiuterį atliekamas Rankiniu būdu Automatizuotai (tiesiogiai iš sekvenavimo įrenginio)

Genetinės sekos, esančios kompiuterinėse bylose, gali būti analizuojamos daugeliu būdų Pavyzdžiui, gali būti ieškoma atsakymų į šiuos klausimus

1. Ar sekoje yra genų? 2. Ar genai turi reguliuojančias sekas (promotorius, splaisingo

vietas ir kt.)? 3. Ar seka koduoja polipeptidą?

Jei taip,tai kokia šio polipeptido seka? 4. Ar seka yra homologinė kuriai nors kitai sekai? 5. Koks yra evoliucinis ryšys tarp dviejų ar daugiau genetinių

sekų?

10-41

Page 42: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Genetinės informacijos kiekis, nustatomas mokslininkų, yra itin didelis

Ši informacija kompiuterinių bylų pavidalu yra kaupiama genetinių duomenų bazėse Bylos tokiose duomenų bazėse dažniausiai yra anotuotos

Jose yra genetinė seka ir detalus jos aprašymas Be to, pateikiamos kitos svarbios sekų ypatybės

Pasaulyje egzistuoja keletas didelių genetinių duomenų bazių, turinčių duomenis iš tūkstančių laboratorijų

10-42

Kompiuterinės duomenų bazės

Page 43: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Pagrindinės genetinių duomenų bazės

Tipas Aprašymas

Nukleotidų sekos

Duomenys kaupiami trijose bendradarbiaujančiose duomenų bazėse: GenBank (JAV), EMBL (European Molecular Biology Laboratory Nucleotide Sequence Database) ir DDBJ (DNA Data Bank of Japan).

Aminorūgščių sekos

Pagrindinės duomenų bazės yra šios: Swissprot (Swiss Protein Database), PIR (Protein Information Resource), Genpept (transliuojamų peptidų sekos iš GenBank db), TrEMBL (transliojamų peptidų sekos iš EMBL db)

Erdvinės struktūros

PDB (Protein Data Bank) saugomos biologinių makromolekulių, pagrindinai baltymų, erdvinės struktūros. Pagrindiniai duomenys gauti rentgenostruktūrinės analizės būdu arba naudojam BMR.

Baltymų motyvai

Prosite yra duomenų bazė, kaupianti informaciją apie baltymų motyvus, būdingus baltymų šeimoms, domenų struktūroms ar potransliacinėms modifikacijoms

10-43

Page 44: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Anksčiau paminėtos genetinių duomenų bazės kaupia informaciją apie daugelį skirtingų biologinių rūšių

Taip pat yra kuriamos genomo duomenų bazės Tai yra specializuotos duomenų bazės, kuriose kaupiami

duomenys apie atskiras rūšis Jų pagrindinis tikslas yra susisteminti sekvenavimo ir

kartografavimo rezultatus Genomo duomenų bazėse taip pat yra duomenų apie

alelius, tyrimus atliekančius mokslininkus ir bibliografinės rodyklės

10-44

Kompiuterinės duomenų bazės

Page 45: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Kompiuterinės programos gali aptinkti reikšmingas vietas labai ilgose sekose

Jų veikimo principas gali būti pademonstruotas 54 raidžių sekos pavyzdžiu:

10-45

Skirtingos analizės strategijos

GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE

Šią seką galima analizuoti bent trimis būdais

Page 46: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Pirmoji programa gali nustatyti visus anglų kalbos žodžius, esančios šioje sekoje:

10-46

GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE

Antroji programa nustato žodžių serijas, kurios formuoja gramatiškai teisingą sakinį:

GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE

Trečioji programa aptinka penkių raidžių sekas, kurios randamos orientuotos priešingomis kryptimis:

GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE

Page 47: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Taigi, kompiuterių programos atpažįsta arba sekas, arba struktūras

Sekų atpažinimas Programa turi informacijos, kad specifinė seka ar simboliai

turi specializuotą reikšmę Turėdama šią informaciją, pirmoji programa gali nustatyti sekas ar

raides, kurios sudaro žodžius

Struktūrų atpažinimas Nėra paremtas specifinių sekų turimos informacijos

atpažinimu Šio tipo programos (pvz., pavyzdžio trečioji programa) ieško tam

tikrų dėsningų struktūrų, kurios gali būti bet kurioje sekoje ar sekų grupėje

10-47

Page 48: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Anksčiau paminėtos programos iliustruoja pagrindines sekų identifikavimo strategijas: 1. Nustatomos prasmingos specializuotos sekos

(sekų elementai), esančios labai ilgoje genetinėje sekoje

Kurie sekų elementai prasmingi, yra nustatyta pačioje programoje

Pavyzdys yra pirmoji programa 2. Nustatoma sekų ar jų elementų organizacija

Pavyzdys yra antroji programa 3. Nustatoma sekų struktūra

Pavyzdys yra trečioji programa

10-48

Page 49: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Genetinė seka, turinti tam tikrą funkciją, yra vadinama sekos elementu arba sekos motyvu

Taip pat aptikti specifiniai aminorūgščių motyvai, atliekantys baltymuose specializuotas funkcijas Pvz., asparaginas–X–serinas (kur X yra bet kuri

aminorūgštis) yra eukariotų baltymų glikozilinimo vieta

Prosite duomenų bazėje yra kaupiamos žinios apie aminorūgščių motyvus, turinčius funkcinę reikšmę

Tokia duomenų bazė padeda greičiau išsiaiškinti naujai aptiktų baltymų funkcijas

10-49

Page 50: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Trumpi sekų elementai, nustatomi kompiuterinės analizės metu

Sekos tipas Pavyzdys

Promotoriai Daugelis E.coli promotorių turi TTGACA (-35 padėtis) ir TATAAT (-10 padėtis) sekas. Eukariotų promotoriai gali turėti CAAT, GC, TATA dėžutes ir t.t

Atsako elementai Gliukortikoidų atsako elementai (AGRACA), cAMP atsako elementai (GTGACGTRA)

Starto kodonas ATG

Stop kodonai TAA, TAG, TGA

Splaisingo vieta GTRAGT------------------YNYTRAC(Y)nAG

Poliadenilinimo signalas AATAAAA

Aukšto dažnio kartotinės sekos

Santykinai trumpos sekos, pasikartojančios genome daugelį kartų

Transpozabilūs elementai

Paprastai nustatomi pagal tai, kad tiesioginės pasikartojančios sekos yra apsuptos invertuotų pasikartojančių sekų

R – bet kuris purinas, Y – bet kuris pirimidinas, N - bet kuri bazė

10-50

Page 51: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Genų nustatymui kompiuterinės programos gali naudoti skirtingas strategijas:

Paieška pagal signalą Programa bando nustatyti žinomų sekų elementų, dažniausiai

randamų genuose, išsidėstymą tiriamoje sekoje Promotoriai, starto/stop kodonai

Paieška pagal turinį Programa stengiasi nustatyti sekas, kurių nukleotidų sudėtis

skiriasi nuo atsitiktinio pasiskirstymo Tai daroma todėl, kad struktūriniuose genuose kodonai naudojami

neatsitiktinai

10-51

Struktūrinių genų nustatymas

Page 52: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Kitas būdas nustatyti koduojančias sritis yra analizuoti transliuojamus skaitymo rėmelius

DNR sekoje kodonų nuskaitymas gali prasidėti nuo pirmojo, antrojo arba trečiojo nukleotido Tai 1, 2 ir 3-as skaitymo rėmeliai

Atviras skaitymo rėmelis (open reading frame - ORF) yra nukleotidų seka, neturinti stop kodonų Prokariotams būdingi ilgi atviri skaitymo rėmeliai Eukariotų koduojančios sekos gali būti pertrauktos

intronų10-52

Page 53: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-53

Kompiuterinė programa gali nustatyti visus atvirus skaitymo rėmelius genominėje DNR sekoje, ieškodama ilgo ASR

Stop kodonai

Ilgas ASR

Taip pat gali būti, kad seka nuskaitoma iš kairės į dešinę Todėl naujai nustatytoje sekoje galimi šeši rėmelių skaitymo variantai

Page 54: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

DNR sekvenavimo duomenys leidžia tirti evoliucinius ryšius molekuliniame lygmenyje Tokie tyrimai tapo galingu genomikos tyrimų metodu

Lyginant genetines sekas, kartais galima aptikti dvi ar daugiau panašių sekų

10-54

Kompiuterinės programos gali nustatyti homologines sekas

Page 55: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-55

lacY geno DNR sekos ~ 78% bazių sutampa

Šiu atveju sekos panašios, nes du tiriami genai yra homologiški Jie išsivystė iš to paties protėvinio geno

Page 56: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-56

Atsitiktinių mutacijų kaupimasis dviejuose genuose

Du lacY genai yra

panašūs, bet nevienodi

Page 57: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-57

Kai du homologiniai genai yra randami skirtingose rūšyse, jie yra vadinami ortologais

Kai du homologiniai genai randami tame pačiame organizme, jie yra vadinami paralogais Genų šeima, sudaryta iš dviejų ar daugiau homologinių

genų kopijų, esančių to paties organizmo genome

Svarbu nepainioti sąvokų homologija ir panašumas Homologija nurodo bendrą kilmę Panašumas reiškia didelį sekų sutapimo laipsnį Daugeliu atveju panašumas yra dėl homologijos

Tačiau taip yra ne visada

Page 58: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Makromolekulių, tokių kaip DNR, RNR ir baltymai, funkcijos priklauso nuo jų struktūros Jų erdvinė struktūra iš tiesų priklauso nuo juos sudarančių

elementų linijinio išsidėstymo Dabartiniu metu erdvinė makromolekulių struktūra

tyrinėjama naudojant pagrindinai biofizikinius metodus Pvz., rentgenokristalografiją ir BMR Šie metodai yra techniškai sudėtingi ir reikalauja daug laiko DNR sekvenavimas yra žymiai paprastesnis

10-58

Tiriant genų sekas galima nusakyti RNR ir baltymų struktūrą

Page 59: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

RNR molekulės paprastai sudaro antrines struktūras, turinčias dvigrandinines sritis Šios struktūros yra toliau lankstomos ir

pakuojamos, susidarant tretinėms struktūroms Genetikus šios struktūros domina, nes nuo jų

priklauso molekulių funkcijos

Todėl RNR struktūrų kompiuterinis modeliavimas yra svarbus tokių tyrimų instrumentas

10-59

Page 60: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

10-60

Šioje struktūroje yra 45 smeigtuko

galvutės struktūros

E.coli 16S RNR antrinės struktūros modelis

Page 61: STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA

Struktūros nustatymas taip pat naudojamas ir proteomikoje

Pasikartojantys baltymų struktūriniai elementai yra spiralės ir klostės

Keletas kompiuterinių programų yra naudojamos antrinei baltymų struktūrai nustatyti, remiantis pirmine jų struktūra Šios programos remiasi keletu skirtingų parametrų

Dažniausiai yra naudojami aminorūgščių statistiniai dažniai, nustatyti tiriant tas antrines struktūras, kurios buvo kristalizuotos

Baltymų antrinės struktūros kompiuterinio nustatymo tikslumas siekia 60-70%

10-61