10
Transkriptiotekijöid en sitoutumisen mallintaminen Kandidaattiseminaari 5.5.2008 Janne Peltola

Transkriptiotekijöiden sitoutumisen mallintaminen

Embed Size (px)

DESCRIPTION

BioIT-kandidaattiseminaarissa pitämäni esitelmä transkriptiotekijöiden sitoutumiskohtien ennustamisesta Random Forest -algoritmilla.

Citation preview

Page 1: Transkriptiotekijöiden sitoutumisen mallintaminen

Transkriptiotekijöiden sitoutumisen

mallintaminenKandidaattiseminaari 5.5.2008

Janne Peltola

Page 2: Transkriptiotekijöiden sitoutumisen mallintaminen

Central Dogma

DNA RNA mRNA

mRNAproteiini

Transkriptionohjaus

RNA:nmuokkaus

RNA:nkuljetus

Translaationohjaus

Proteiinienmuokkaus

proteiini

5.5.2008 2Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 3: Transkriptiotekijöiden sitoutumisen mallintaminen

Transkription ohjaus

tehostaja promoottori eksoni

ACGTTAGCAAA CCTTTAACCATTG GGGGATCATATA GGTTAACCTTAA

RNA-polymeraasi

5.5.2008 3Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 4: Transkriptiotekijöiden sitoutumisen mallintaminen

Transkription reunaehdot

Sopiva kemiallinen ympäristö Sekvenssi Metylaatio Sentromeerien sijainti

DNA:n laskostuminen Muut vuorovaikutukset

Muut tuman molekyylit

5.5.2008 4Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 5: Transkriptiotekijöiden sitoutumisen mallintaminen

DNA-piirre

Nukleotidien jakauma

Kuvaa tietylle molekyylille sopivaa sitoutumiskohtaa

A [ 7 9 4 0 16 7 0 6 0 0 6 0 ] C [ 8 0 2 15 0 0 15 0 0 10 0 0 ] G [ 1 7 10 1 0 9 1 0 16 6 0 16 ] T [ 0 0 0 0 0 0 0 10 0 0 10 0 ]

5.5.2008 5Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 6: Transkriptiotekijöiden sitoutumisen mallintaminen

Piirteiden löytäminen

Kokeilla saadaan tietyn molekyylin sitoutumiskohtien sekvenssit

Jos kohdan sekvenssi ei vastaa piirrettä, on todennäköisesti löydetty vuorovaikutussuhde

5.5.2008 6Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 7: Transkriptiotekijöiden sitoutumisen mallintaminen

Ennustaminen

Kokeiden perusteella saadaan matriisi Piirteiden frekvenssit eri alueilla

Matriisista nähdään eri piirteiden vaikutus alueen geenin ilmentymiseen

ABI4 Agamous AGL3 Ar Arnt-Ahr Arnt ARR10

AllSet35_05_102 1 6 6 3 1 NA 6

AllSet35_05_103 1 11 7 2 NA NA 1

AllSet35_05_1075 NA 6 7 3 NA NA 4

AllSet35_05_1076 2 7 4 3 1 NA 2

AllSet35_05_1077 1 10 3 NA 2 NA 2

AllSet35_05_1078 1 9 7 NA 1 NA NA

AllSet35_05_1079 6 9 4 2 2 1 3

AllSet35_05_108 3 7 11 NA 4 NA 2

5.5.2008 7Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 8: Transkriptiotekijöiden sitoutumisen mallintaminen

Päätöspuuryppäät

Päätöspuurypäs on joukko päätöspuita Määrä kompensoi prediktorin epästabiiliutta Rypäs ei yliopi

Rypäs tuottaa Ennustuksen Arvion eri muuttujien

vaikutuksestaennusteeseen

5.5.2008 8Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 9: Transkriptiotekijöiden sitoutumisen mallintaminen

Tulos

Luettelo eri piirteiden merkittävyydestä geenin ilmentymistasoon

Voidaan tehdä jatkokokeita sitoutuvatko nämä

molekyylit juuri ennustettuihin kohtiin

RUNX1 0,00251runt-related transcription factor 1 (acute myeloid leukemia 1; aml1 oncogene)

FOXF2 0,001855 forkhead box F2

MZF1_1.4 0,001577 myeloid zinc finger 1

Klf4 0,001435 Kruppel-like factor 4 (gut)

BRCA1 0,001331 breast cancer 1, early onset

hb 0,001198 hunchback

NR3C1 0,001121nuclear receptor subfamily 3, group C, member 1

GATA3 0,0011 GATA binding protein 3

Fos 0,001057v-fos FBJ murine osteosarcoma viral oncogene homolog

Arnt.Ahr 0,001051aryl hydrocarbon receptor nuclear translocator bound with aryl hydrocarbon receptor

NHLH1 0,001038 nescient helix loop helix 1

NFIL3 0,001027 nuclear factor, interleukin 3 regulated

PBX1 0,000952 pre-B-cell leukemia homeobox 1

HNF4A 0,000908 hepatic nuclear factor 4, alpha

5.5.2008 9Transkriptiotekijöiden

sitoutumisen ennustaminen

Page 10: Transkriptiotekijöiden sitoutumisen mallintaminen

Tiivistelmä

Biologinen koePiirteiden

löytäminen

Ennustus

Sitoutumiskohdat ja ilmentymistasot

frekvenssimatriisimahdollisiatranskriptiotekijöitä

5.5.2008 10Transkriptiotekijöiden

sitoutumisen ennustaminen