Upload
ham
View
169
Download
0
Embed Size (px)
DESCRIPTION
STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, PROTEOMIKA IR BIOINFORMATIKA. ĮVADAS. G enomi ka y r a rūšies viso genomo molekulinė analizė Genom o analizę sudaro dvi pagrindinės fazės Genolapio sudarymas Se kvenavimas (nukleotidų sekos nustatymas) - PowerPoint PPT Presentation
Citation preview
STRUKTŪRINĖ IR STRUKTŪRINĖ IR FUNKCINĖ GENOMIKA, FUNKCINĖ GENOMIKA,
PROTEOMIKA IR PROTEOMIKA IR BIOINFORMATIKABIOINFORMATIKA
ĮVADAS
Genomika yra rūšies viso genomo molekulinė analizė Genomo analizę sudaro dvi pagrindinės fazės
Genolapio sudarymas Sekvenavimas (nukleotidų sekos nustatymas)
1995 m. mokslininkai vadovaujami Craigo Venterio ir Hamiltono Smitho nustatė pirmojo organizmo pilną DNR seką Tai buvo bakterija Haemophilus influenzae
10-2
10-3
Bakterijos Haemophilus influenzae pilnas genolapis
1.83 milijonų bp
~ 1,743 genų
1996 m. buvo pabaigtas pirmojo eukariotinio organizmo genomo tyrimas. Jį atliko pasaulinis mokslininkų konsorciumas, vadovaujamas Andre Goffeau iš Belgijos
Saccharomyces cerevisiae Genomą sudaro 16 linijiškų chromosomų
~ 12 milijonų bp, ~ 6,200 genų Vėliau buvo sekvenuoti kitų organizmų genomai, įskaitant
žmogų
Struktūrinė genomika prasideda genolapio sudarymu ir baigiasi pilnu genomo sekvenavimu
Funkcinė genomika tiria, kaip genų sąveikos skuria organizmo požymius
Funcinės genomikos pagrindinė paskirtis yra išsiaiškinti genetinių sekų reikšmę organizmo funkcionavimui
Daugeliu atvejų tai leidžia suprasti geno funkciją
10-4
Pilnas rinkinys baltymų, kuriuos gali sintetinti organizmas, yra vadinamas proteomu
Proteomika yra visų genomo koduojamų baltymų ir jų sąveikų tyrimas
Proteomikos tikslas yra išsiaiškinti organizmo baltymų funkcinę paskirtį Taip pat ji siekia ištirti baltymų sąveikas
Bioinformatikos tikslas yra perskaityti informaciją, esančią genetinėse sekose, naudojant matematinius/kompiuterinius metodus
10-5
DNR sričių struktūrinė organizacija paprastai nustatoma trimis būdais
1. Citogenetinis (geno)kartografavimas Remiasi mikroskopine analize Genai siejami su chromosomų ruožais
2. Sankibos (geno)kartografavimas Remiasi kryžminimais Nustatoma genų padėtis vienas kito atžvilgiu
Atstumai matuojami genolapio vienetais (arba centimorganais)
3. Fizinis (geno)kartografavimas Remiasi DNR klonavimo metodais Nustatoma genų padėtis vienas kito atžvilgiu
Atstumai matuojami bazių poromis
10.1 STRUKTŪRINĖ GENOMIKA
10-6
Citogenetinis kartografavimas remiasi mikroskopija Dažniausiai naudojamas tiriant eukariotus, turinčius dideles
chromosomas
Eukariotų chromosomas galima atskirti pagal Dydį Centromeros padėtį Ruožuotumą
Ruožuotumas išryškėja chromosomas nudažius specifiniais dažais Jis naudojamas genų kartografavimui
Citogenetinis (geno)kartografavimas
10-7
Darant citogenetinį kartografavimą yra bandoma nustatyti genų išsidėstymą specifinių chromosomos ruožų atžvilgiu Dažniausiai tai yra augalų ir gyvūnų genų lokalizacijos
nustatymo pirmasis etapas
Citogenetinis kartografavimas remiasi mikroskopija Todėl jo skiriamoji geba yra gana limituota
Daugelio rūšių atveju ji yra ~ 5 milijonus bp
Skiriamoji geba daug geresnė toms rūšims, kurios turi politenines chromosomas
Pvz., Drosophila melanogaster
10-8
Hibridizacija in situ padeda nustatyti geno padėtį intaktinėse chromosomose Ji naudojama nustatyti genų ar DNR sekų lokalizaciją
didelėse eukariotų chromosomose
Naudojami zondai, padedantys aptikti ieškomas DNR sekas (“taikinį”)
Dažniausiai naudojami fluorescenciniais dažais pažymėti DNR zondai Šis metodas vadinamas fluorescencine in situ hibridizacija
(FISH)
Hibridizacija in situ
10-9
10-10Fluorescencinės in situ hibridizacijos (FISH) metodas
Ląstelės veikiamos medžiagomis, fiksuojančiomis jas ant stikliuko
DNR zondai yra chemiškai modifikuoti taip, kad prie jų
gali prisijungti fluorescuojanti žymė
Fluorescencinių zondų skleidžiamai šviesai aptikti yra naudojami fluorescenciniai mikroskopai Fluorescuojantis zondas yra matomas kaip
švytinti sritis nešvytinčiame fone Zondai prisitvirtina tik prie specifinių sekų
FISH eksperimentų rezultatai yra lyginami su Giemsa dažais nudažytų chromosomų vaizdu Zondo padėtis gali būti nusakoma G ruožų
atžvilgiu
10-11
10-12
10-13
Sankibos kartografavimas remiasi rekombinantinių palikuonių dažnio skaičiavimu Visi genai, esantys vienoje chromosomoje, yra paveldmi
kartu sukibę, t.y. sudaro vieną sankibos grupę Jei įvyksta krosingoveris, gali pasikeisti sukibusių genų seka Krosingoverio dažnis tuo mažesnis, kuo arčiau vienas kito
yra sukibę genai
Gali būti sudaromi ne genų, o genetinių žymenų genolapiai. Molekulinis žymuo yra DNR fragmentas, kuris randamas specifinėje chromosomos vietoje ir gali būti specifiškai atpažintas Kaip ir alelių atveju, molekulinių žymenų ypatybės gali skirtis
tarp skirtingų individų
Sankibos (geno)kartografavimas
10-14
Restrikcijos fermentai atpažįsta specifines DNR sekas ir jose kerpa DNR
Ilgose chromosomose gali būti daug vietų, kurias atpažįsta ir kerpa restrikcijos fermentai Jos yra pasiskirstę atsitiktinai Lyginant du individus galima aptikti tokių
atpažinimo vietų kiekio ir/ar išsidėstymo skirtumus
Restrikcijos fragmentų ilgio polimorfizmas (RFLP)
10-15
10-16
10-17
10-18Restrikcijos fragmentų ilgio polimorfizmas (RFLP)
Restrikcijos vieta, randama tik 1-ame individe
Populiacijoje stebimas DNR fragmentų ilgio polimorfizmas
Ši variacija gali atsirasti dėl delecijų, duplikacijų, genų mutacijų
ir t.t.
Rodyklės rodo restriktazių kirpimo vietas
Trijų individų chromosominės DNR RFLP analizė
EcoRI kirpimo vietos yra abiejose
chromosomose
10-19
EcoRI kirpimo vietų nėra abiejose
chromosomose
10-20
EcoRI kirpimo vieta yra tik vienoje chromosomoje
Trys individai turi daug bendrų vienodo ilgio DNR
fragmentų
Jei šie fragmentai randami 99% visų populiacijos individų, jie vadinami
monomorfiniais
Polimorfinės juostos pažymėtos strėlėmis
RFLP sankibos analizė gali būti atlikta su daugeliu RFLP žymenų, nustatant jų santykinę padėtį genome
Genolapis, sudarytas iš daugelio RFLP žymenų, vadinamas RFLP genolapiu RFLP genolapiai naudojami genų padėčiai
nustatyti tam tikroje chromosomoje
RFLP genolapiai
10-21
10-22
Kairiojoje pusėje nurodyta
RFLP žymenų išsidėstymas
Dešiniojoje pusėje nurodyti
genetiniai atstumai
Keletas žinomų genų
pažymėti raudonai
Supaprastintas augalo Arabidopsis thaliana RFLP genolapis
Fiziniam kartografavimui atlikti reikia klonuoti daugelį chromosominės DNR fragmentų
Klonuoti DNR fragmentai yra apibūdinami pagal 1. Dydį 2. Turimus genus 3. Padėtį chromosomoje
Pastaraisiais metais naudojant fizinį kartografavimą sekvenuoti ištisi genomai
Fizinis (geno)kartografavimas
10-23
10-24
Atliekamas plataus masto genomų sekvenavimas leidžia tyrinėti genų veiklą daug sudėtingesniame lygmenyje Dabar galima vienu metu tirti daugelio genų grupių
veiklą Vienas iš pagrindinių genominių tyrimų tikslų
yra nustatyti tas DNR sritis, kuriose iš tiesų yra genų Vienas būdų tai padaryti yra parodyti, kad tiriama
sritis yra transkribuojama į RNR
10.2 FUNKCINĖ GENOMIKA
10-25
Tai padaroma sukuriant cDNA biblioteką cDNR (copy DNA) yra gaunama atvirkštinės transkriptazės pagalba
susintetinus DNR nuo mRNR, išskirtos iš ląstelės cDNR biblioteka taip pat vadinama EST biblioteka (expressed
sequence tag library) Šios sekos taip pat gali būti naudojamos kaip žymenys, atliekant fizinį
chromosomų kartografimą EST bibliotekoje esančios sekos gali būti sekvenuotos ir
vėliau palygintos su genomo sekomis Atitikimai rodo, kurios genomo vietos koduoja genus
cDNR bibliotekos sukūrimas padeda tirti genų reguliaciją genomo lygmenyje
Tokių tyrimų strategija yra išskirti mRNR esant skirtingoms ląstelės ar organizmo funkcionavimo sąlygoms
Tada galima nustatyti tas mRNR, kurios yra sintetinamos tik esant vienokioms ar kitokioms sąlygoms
Genų ekspresija gali būti nustatyta cDNR bibliotekoje
10-26
Sukurtas naujas tyrimo metodas, vadinamas DNR mikrogardelėmis (taip pat vadinama genų lustais) Šis naujas metodas leidžia vienu metu tirti tūkstančių genų
veiklą
DNR mikrogardelė yra maža silicio, stilo ar plastiko plokštelė, padengta daugelio DNR sekų taškeliais Kiekviena iš šių sekų atitinka vieną žinomą geną
Šios sekos veikia kaip zondai, aptinkantys transkribuojamus genus
10-27
Mikrogardelės gali nustatyti transkribuojamus genus
Šie DNR fragmentai gali būti Amplifkuoti PGR pagalba ir vėliau pritvirtinti ant
mikrogardelės Tiesiogiai susintetinti ant mikrogardelės Viena mikrogardelė turi dešimtis tūkstančių skirtingų taškų,
o jos dydis neviršia pašto ženklo Kiekvieno taško (su skirtingo geno DNR) padėtis gardelėje yra
tiksliai žinoma
DNR mikrogradelių gamybos technologija yra gana įdomi ir primena technologiją, kuri naudojama rašaliniuose spausdintuvuose
Pagamintos DNR mikrogardelės naudojamos hibridizacijai su cDNR, susintetinta atvirkštinės transkriptazės pagalba nuo iš ląstelės išskirtų mRNR
10-28
10-29
Mikrogardelė nuplaunama
Po to ji tiriama skenuojančiu konfokaliniu fluorescenciniu mikroskopu
Tiriama fluorescuojančios vietos, kurios rodo įvykusią hibridizaciją
10-30
DNR mikrogardelių panaudojimas
Panaudojimas Aprašymas
Specifinėms ląstelėms būdingos genų ekspresijos tyrimai
Lyginant cDNR, gautas iš skirtingų tipų ląstelių, galima nustatyti genus, kurių ekspresija vyksta tik tam tikrose ląstelėse ar audiniuose
Genų reguliacijos tyrimai Galima tirti kintančių aplinkos sąlygų įtaką genų ekspresijai
Metabolizmo kelių tyrimai
Galima tirti visų genų, dalyvaujančių viename ar kitame metabolizmo kelyje, ekspresiją
Vėžinių ląstelių tyrimai Skirtingų tipų vėžinių ląstelių genų ekspresija labai skiriasi. DNR mikrogardeles galima naudoti klasifikacijai navikų, kurie morfologiškai nesiskiria
Genetinio kintamumo tyrimai
Mutantinis alelis gali hibridizuotis su mikrogardele prasčiau, negu laukinio tipo alelis
Mikroorganizmų kamienų identifikacija
Mikrogardelių pagalba galima atskirti giminiškų bakterijų rūšis ar porūšius
10-31
Proteomika tiria organizmo gaminamų baltymų funkcinę paskirtį Pilnas rūšies baltymų rinkinys yra vadinamas proteomu
Genomikos duomenys gali suteikti svarbių žinių apie proteomą 1. DNR mikrogardelės parodo genus, kurie yra
transkribuojami esant tam tikroms sąlygoms 2. Skirtingų rūšių genų homologijos tyrimai gali būti
panaudojami baltymų struktūrai ar funkcijai nuspėti
Tačiau genominius tyrimus turi sekti tiesioginiai pačių baltymų tyrimai
10.3 PROTEOMIKA
10-32
Viso genomo sekvenavimas ir analizė gali padėti nustatyti visus rūšies genus
Tačiau proteomas yra didesnis už genomą ir tikrąjį jo dydį sunku nustatyti Taip įvyksta dėl keletos procesų
1. Alternatyvaus splaisingo 2. RNR redagavimo 3. Potransliacinės kovalentinės modifikacijos
10-33
Proteomas yra žymiai didesnis už genomą
1. Alternatyvus splaisingas Svarbiausias pokytis, atsiradęs eukariotuose Viena pre-mRNR yra pertvarkoma į keletą skirtingų mRNR Splaisingas dažnai yra specifiškas tam tikroms ląstelėms arba tam
tikroms aplinkos sąlygoms 2. RNR redagavimas
Sutinkamas rečiau už alternatyvų splaisingą Pakeičia koduojančią mRNR seką
3. Potransliacinė kovalentinė modifikacija Funkcionaliam baltymui sukurti gali būti reikalingos negrįžtamos
modifikacijos Proteolitinis procesingas; prostetinių grupių, cukrų ar lipidų prisijungimas
Grįžtami pokyčiai gali trumpam pakeisti baltymo funkcijas Fosforilinimas; metilinimas
Visi šie procesai padidina potencialių baltymų kiekį proteome
10-34
Yra kuriamos ir baltymų mikrogardelės
Baltymų mikrogardelių kūrimas yra sudėtingesnis procesas 1. Baltymus žymiai lengviau pažeisti, atliekant įvairias
manipuliacijas, reikalingas mikrogardelei pagaminti 2. Baltymų sintezė ir išgryninimas reikalauja daug daugiau
laiko, lyginant su DNR
Nepaisant to, pastaraisiais metais yra pasiektas tam tikras progresas baltymų mikrogardelių kūrime ir panaudojime proteomikos tyrimuose
10-35
Baltymų mikrogardelės
Baltymų mikrogardelių panaudojimas
Panaudojimas Aprašymas
Baltymų ekspresijos tyrimai
Antikūnų mikrogardelės pagalba galima tirti baltymų ekspresiją, nes kiekvienas antikūnas, esantis mikrogardelės taške, atpažįsta specifinę aminorūgščių seką
Baltymų funkcijos tyrimai
Grupės baltymų substratinis specifiškumas ir fermentinis aktyvumas gali būti tiriami veikiant mikrogardelę skirtingais substratais
Baltymų sąveikos su baltymais tyrimai
Dviejų baltymų gebėjimas sąveikauti gali būti tiriamas veikiant mikrogardelę fluorochromu pažymėtais baltymais
Farmakologiniai tyrimai
Vaistų gebėjimas susijungti su ląstelės baltymais gali būti tiriamas veikiant mikrogardelę įvairiais pažymėtais vaistais
10-36
Yra du pagrindiniai baltymų mikrogardelių tipai 1. Antikūnų mikrogardelės 2. Funkcinės mikrogardelės
Antikūnų mikrogardelės Sudarytos iš rinkinio antikūnų, atpažįstančių
trumpas peptidų sekas Naudojamos įvertinti baltymų ekspresijos laipsniui
Funkcinės mikrogardelės Sudarytos iš daugelio skirtingų ląstelės baltymų Naudojamos baltymų funkcijoms tirti
10-37
Kompiuteris tapo svarbiu genetinių tyrimų instrumentu Genetikos ir informatikos mokslų sandūroje
susikūrė nauja mokslo šaka - bioinformatika
Genetinių sekų kompiuterinei analizei paprastai reikia trijų pagrindinių elementų: Kompiuterio Kompiuterinių programų Genetinių duomenų
10.4 BIOINFORMATIKA
10-38
Kompiuterinė programa yra apibrėžta operacijų seka, kuri gali analizuoti duomenis pasirinktu būdu
Pirmasis kompiuterinės genetinių duomenų analizės etapas yra kompiuterinių duomenų bylos sukūrimas Ši byla yra informacijos rinkinys, tinkamas saugoti ir
manipuliuoti kompiuteryje Pavyzdžiui, bylą gali sudaryti lacY geno iš E. coli DNR
seka
10-39
Sekos analizuojamos naudojant kompiuterines programas
10-40
Skaičiai rodo bazės numerį sekos byloje
Duomenų suvedimas į kompiuterį atliekamas Rankiniu būdu Automatizuotai (tiesiogiai iš sekvenavimo įrenginio)
Genetinės sekos, esančios kompiuterinėse bylose, gali būti analizuojamos daugeliu būdų Pavyzdžiui, gali būti ieškoma atsakymų į šiuos klausimus
1. Ar sekoje yra genų? 2. Ar genai turi reguliuojančias sekas (promotorius, splaisingo
vietas ir kt.)? 3. Ar seka koduoja polipeptidą?
Jei taip,tai kokia šio polipeptido seka? 4. Ar seka yra homologinė kuriai nors kitai sekai? 5. Koks yra evoliucinis ryšys tarp dviejų ar daugiau genetinių
sekų?
10-41
Genetinės informacijos kiekis, nustatomas mokslininkų, yra itin didelis
Ši informacija kompiuterinių bylų pavidalu yra kaupiama genetinių duomenų bazėse Bylos tokiose duomenų bazėse dažniausiai yra anotuotos
Jose yra genetinė seka ir detalus jos aprašymas Be to, pateikiamos kitos svarbios sekų ypatybės
Pasaulyje egzistuoja keletas didelių genetinių duomenų bazių, turinčių duomenis iš tūkstančių laboratorijų
10-42
Kompiuterinės duomenų bazės
Pagrindinės genetinių duomenų bazės
Tipas Aprašymas
Nukleotidų sekos
Duomenys kaupiami trijose bendradarbiaujančiose duomenų bazėse: GenBank (JAV), EMBL (European Molecular Biology Laboratory Nucleotide Sequence Database) ir DDBJ (DNA Data Bank of Japan).
Aminorūgščių sekos
Pagrindinės duomenų bazės yra šios: Swissprot (Swiss Protein Database), PIR (Protein Information Resource), Genpept (transliuojamų peptidų sekos iš GenBank db), TrEMBL (transliojamų peptidų sekos iš EMBL db)
Erdvinės struktūros
PDB (Protein Data Bank) saugomos biologinių makromolekulių, pagrindinai baltymų, erdvinės struktūros. Pagrindiniai duomenys gauti rentgenostruktūrinės analizės būdu arba naudojam BMR.
Baltymų motyvai
Prosite yra duomenų bazė, kaupianti informaciją apie baltymų motyvus, būdingus baltymų šeimoms, domenų struktūroms ar potransliacinėms modifikacijoms
10-43
Anksčiau paminėtos genetinių duomenų bazės kaupia informaciją apie daugelį skirtingų biologinių rūšių
Taip pat yra kuriamos genomo duomenų bazės Tai yra specializuotos duomenų bazės, kuriose kaupiami
duomenys apie atskiras rūšis Jų pagrindinis tikslas yra susisteminti sekvenavimo ir
kartografavimo rezultatus Genomo duomenų bazėse taip pat yra duomenų apie
alelius, tyrimus atliekančius mokslininkus ir bibliografinės rodyklės
10-44
Kompiuterinės duomenų bazės
Kompiuterinės programos gali aptinkti reikšmingas vietas labai ilgose sekose
Jų veikimo principas gali būti pademonstruotas 54 raidžių sekos pavyzdžiu:
10-45
Skirtingos analizės strategijos
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE
Šią seką galima analizuoti bent trimis būdais
Pirmoji programa gali nustatyti visus anglų kalbos žodžius, esančios šioje sekoje:
10-46
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE
Antroji programa nustato žodžių serijas, kurios formuoja gramatiškai teisingą sakinį:
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE
Trečioji programa aptinka penkių raidžių sekas, kurios randamos orientuotos priešingomis kryptimis:
GJTYLLAMAQLHEOGYLTOBWENTMNMTORXXXTGOODNTHEQALLYTLSTORE
Taigi, kompiuterių programos atpažįsta arba sekas, arba struktūras
Sekų atpažinimas Programa turi informacijos, kad specifinė seka ar simboliai
turi specializuotą reikšmę Turėdama šią informaciją, pirmoji programa gali nustatyti sekas ar
raides, kurios sudaro žodžius
Struktūrų atpažinimas Nėra paremtas specifinių sekų turimos informacijos
atpažinimu Šio tipo programos (pvz., pavyzdžio trečioji programa) ieško tam
tikrų dėsningų struktūrų, kurios gali būti bet kurioje sekoje ar sekų grupėje
10-47
Anksčiau paminėtos programos iliustruoja pagrindines sekų identifikavimo strategijas: 1. Nustatomos prasmingos specializuotos sekos
(sekų elementai), esančios labai ilgoje genetinėje sekoje
Kurie sekų elementai prasmingi, yra nustatyta pačioje programoje
Pavyzdys yra pirmoji programa 2. Nustatoma sekų ar jų elementų organizacija
Pavyzdys yra antroji programa 3. Nustatoma sekų struktūra
Pavyzdys yra trečioji programa
10-48
Genetinė seka, turinti tam tikrą funkciją, yra vadinama sekos elementu arba sekos motyvu
Taip pat aptikti specifiniai aminorūgščių motyvai, atliekantys baltymuose specializuotas funkcijas Pvz., asparaginas–X–serinas (kur X yra bet kuri
aminorūgštis) yra eukariotų baltymų glikozilinimo vieta
Prosite duomenų bazėje yra kaupiamos žinios apie aminorūgščių motyvus, turinčius funkcinę reikšmę
Tokia duomenų bazė padeda greičiau išsiaiškinti naujai aptiktų baltymų funkcijas
10-49
Trumpi sekų elementai, nustatomi kompiuterinės analizės metu
Sekos tipas Pavyzdys
Promotoriai Daugelis E.coli promotorių turi TTGACA (-35 padėtis) ir TATAAT (-10 padėtis) sekas. Eukariotų promotoriai gali turėti CAAT, GC, TATA dėžutes ir t.t
Atsako elementai Gliukortikoidų atsako elementai (AGRACA), cAMP atsako elementai (GTGACGTRA)
Starto kodonas ATG
Stop kodonai TAA, TAG, TGA
Splaisingo vieta GTRAGT------------------YNYTRAC(Y)nAG
Poliadenilinimo signalas AATAAAA
Aukšto dažnio kartotinės sekos
Santykinai trumpos sekos, pasikartojančios genome daugelį kartų
Transpozabilūs elementai
Paprastai nustatomi pagal tai, kad tiesioginės pasikartojančios sekos yra apsuptos invertuotų pasikartojančių sekų
R – bet kuris purinas, Y – bet kuris pirimidinas, N - bet kuri bazė
10-50
Genų nustatymui kompiuterinės programos gali naudoti skirtingas strategijas:
Paieška pagal signalą Programa bando nustatyti žinomų sekų elementų, dažniausiai
randamų genuose, išsidėstymą tiriamoje sekoje Promotoriai, starto/stop kodonai
Paieška pagal turinį Programa stengiasi nustatyti sekas, kurių nukleotidų sudėtis
skiriasi nuo atsitiktinio pasiskirstymo Tai daroma todėl, kad struktūriniuose genuose kodonai naudojami
neatsitiktinai
10-51
Struktūrinių genų nustatymas
Kitas būdas nustatyti koduojančias sritis yra analizuoti transliuojamus skaitymo rėmelius
DNR sekoje kodonų nuskaitymas gali prasidėti nuo pirmojo, antrojo arba trečiojo nukleotido Tai 1, 2 ir 3-as skaitymo rėmeliai
Atviras skaitymo rėmelis (open reading frame - ORF) yra nukleotidų seka, neturinti stop kodonų Prokariotams būdingi ilgi atviri skaitymo rėmeliai Eukariotų koduojančios sekos gali būti pertrauktos
intronų10-52
10-53
Kompiuterinė programa gali nustatyti visus atvirus skaitymo rėmelius genominėje DNR sekoje, ieškodama ilgo ASR
Stop kodonai
Ilgas ASR
Taip pat gali būti, kad seka nuskaitoma iš kairės į dešinę Todėl naujai nustatytoje sekoje galimi šeši rėmelių skaitymo variantai
DNR sekvenavimo duomenys leidžia tirti evoliucinius ryšius molekuliniame lygmenyje Tokie tyrimai tapo galingu genomikos tyrimų metodu
Lyginant genetines sekas, kartais galima aptikti dvi ar daugiau panašių sekų
10-54
Kompiuterinės programos gali nustatyti homologines sekas
10-55
lacY geno DNR sekos ~ 78% bazių sutampa
Šiu atveju sekos panašios, nes du tiriami genai yra homologiški Jie išsivystė iš to paties protėvinio geno
10-56
Atsitiktinių mutacijų kaupimasis dviejuose genuose
Du lacY genai yra
panašūs, bet nevienodi
10-57
Kai du homologiniai genai yra randami skirtingose rūšyse, jie yra vadinami ortologais
Kai du homologiniai genai randami tame pačiame organizme, jie yra vadinami paralogais Genų šeima, sudaryta iš dviejų ar daugiau homologinių
genų kopijų, esančių to paties organizmo genome
Svarbu nepainioti sąvokų homologija ir panašumas Homologija nurodo bendrą kilmę Panašumas reiškia didelį sekų sutapimo laipsnį Daugeliu atveju panašumas yra dėl homologijos
Tačiau taip yra ne visada
Makromolekulių, tokių kaip DNR, RNR ir baltymai, funkcijos priklauso nuo jų struktūros Jų erdvinė struktūra iš tiesų priklauso nuo juos sudarančių
elementų linijinio išsidėstymo Dabartiniu metu erdvinė makromolekulių struktūra
tyrinėjama naudojant pagrindinai biofizikinius metodus Pvz., rentgenokristalografiją ir BMR Šie metodai yra techniškai sudėtingi ir reikalauja daug laiko DNR sekvenavimas yra žymiai paprastesnis
10-58
Tiriant genų sekas galima nusakyti RNR ir baltymų struktūrą
RNR molekulės paprastai sudaro antrines struktūras, turinčias dvigrandinines sritis Šios struktūros yra toliau lankstomos ir
pakuojamos, susidarant tretinėms struktūroms Genetikus šios struktūros domina, nes nuo jų
priklauso molekulių funkcijos
Todėl RNR struktūrų kompiuterinis modeliavimas yra svarbus tokių tyrimų instrumentas
10-59
10-60
Šioje struktūroje yra 45 smeigtuko
galvutės struktūros
E.coli 16S RNR antrinės struktūros modelis
Struktūros nustatymas taip pat naudojamas ir proteomikoje
Pasikartojantys baltymų struktūriniai elementai yra spiralės ir klostės
Keletas kompiuterinių programų yra naudojamos antrinei baltymų struktūrai nustatyti, remiantis pirmine jų struktūra Šios programos remiasi keletu skirtingų parametrų
Dažniausiai yra naudojami aminorūgščių statistiniai dažniai, nustatyti tiriant tas antrines struktūras, kurios buvo kristalizuotos
Baltymų antrinės struktūros kompiuterinio nustatymo tikslumas siekia 60-70%
10-61