Upload
giustina-massa
View
221
Download
2
Embed Size (px)
Citation preview
Specie Dimensione Genoma (Mb)
N. Geni approx Refer.
Arabidopsis thaliana 125 25.500 (2000)
Caenorhabditis elegans 97 19.000 (1998)
Drosophila melanogaster 180 13.600
(2000)
Homo sapiens 3200 30.000/40.000 (2001)
S. Cerevisiae 12,1 5.800 (1996)
Escherichia coli 4,64 4.400
(1987)
M.tubercolosis 4,41 4.000 (1998)
Archaeoglobus fulgidus 2,18 2.500 (1997)
Methanococcus jannaschii 1,66 1.750
(1996)
densità genicamatch ESTsdensitàtrasposoni
The Arabidopsis genome
I
II
III
IV
V
• 60% genoma duplicato• 60% genoma in forma 2X e non 3X• Segmenti duplicati in orientamento diretto o invertito• Centromeri in nero
Dimensione 29.105 19.646 23.172 17.549 25.953
DNA
1dominio TM 35.7% 32.8% 30.9% 36.7% 33.0%
Proteoma
Con signal peptidePathway secrez. 17.5% 15.7% 15.7% 16.5% 16.4%
Cloroplasto 9.2% 7.2% 8.1% 7.8% 8.1%
Mitocondrio 1.7% 1.2% 1.2% 1.5% 1.1%
1 2 3 4 5
Cromosomi
N. geni 6.543 4.036 5.220 3.825 5.874
Dimens.media geni 2.078 1.949 1.925 2.138 1.974
Geni con EST 60.8% 56.9% 59.8% 61.4% 61.4%
Esoni/gene 5.4 4.9 5.1 5.2 5.3
Taglia Esoni 247bp 259 250 256 242
Taglia Introni 168bp 177 159 166 159
Caratteristiche dei 3 genomi di Arabidopsis
nucleo/citoplasma plastidio mitocondrio Taglia 125Mb 154Kb 367Kbn.genoma/cellula 2 560 26
Duplicaz.genica 60% 17% 10%
n.geni x prot. 25.498 79 58
ordine genico variabile conservato variabileDensità(Kb/gene) 45 1.2 6.25
Lung.genica media 1.9 0.9 0.86
Trasposoni 14% 0% 4%
2000: The genome has ben sequenced,The papers published,
The champagne polished off,......... Now WHAT???
1996: Consorzio Internazionale(AGI:Arabidopsis Genome Initiative) x il sequenziamento di Arabidopsis
Functional GenOMICS
Arabidopsis Functional GenOMICS
•Transcriptomics:analisi dei profili d’espressione, regolazione trascrizionale
•ORFeomics:analisi di cDNA, regolazione post-trascrizionale
•Proteomics:analisi dei profili proteici, 2° messaggeri, regolazione post-traduzionale
•Metabolomics:analisi dei metaboliti secondari
Transcription
Cellular biogenesis
Ionic homeostasis
Cell death, ageingCell rescue
Cell growth, divisionDNA synth.
Protein destination
Protein synthesis
Energy
Intracellular transport
Signal transduction
Transport facilitation
Metabolism
Unclassified 30%
Functional Genomics
S.cerevisiae
A..thaliana
C.elegans
Drosophila
H.sapiens
Proc
essi cel
lula
ri
Met
abol
ism
o
Replic
az.D
NA/M
odif.
Tras
crizio
ne/T
radu
zion
e
Segn
ali i
ntra
cellu
lari
Com
unicaz
ione
cel
l-cel
l
Fold
ing
prot
eine
Deg
rada
zion
eTr
aspo
rto
Prot
eine
mul
tifu
nzio
n.
Cito
sche
l./st
ruttur
.
Dife
sà e
Imm
unità
Funz
ioni
misce
llane
e
Categorie geniche x funzioneN
um
ero
di g
en
i
Cel
lula
r b
ioge
nes
is
Ion
ic h
omeo
stas
is
Cel
l dea
th, a
gein
gC
ell r
escu
e
Cel
l gro
wth
, d
ivis
ion
DN
A s
ynth
.
Pro
tein
des
tin
atio
n
En
ergy
Intr
acel
lula
r t
ran
spor
t
Sig
nal
tra
nsd
uct
ion
Tra
nsp
ort
fac
ilit
atio
n
Met
abol
ism
Un
clas
sifi
ed 3
0%
not
yet
cle
ar-c
ut
Tra
nsc
rip
tion
• Solo 8/23% TFs hanno geni correlati in yeast-human• Evoluzione indipendente dei TFs?• In Arabidopsis 2-3X TFs rispetto a Drosophila, C. elegans
Pro
tein
syn
thes
is
• 48/60&% dei geni coinvolti nella sintesi proteica sono conservati rispetto agli altri genomi eucariotici, sottolineando funzioni geniche altamente conservate
%p
rote
ine A
.t.
di u
na c
lasse c
on
Bla
stP
+
Multinational Arabidopsis Steering Committee MASC
Programma di 10 anni, iniziato nel 2001Gli obiettivi:. Determinare la funzione di ogni gene di Arabidopsis. Ottenere una comprensione chiara e dettagliata dei processi molecolari che regolano lo sviluppo di Arabidopsis le conoscenze ottenute su questo organismo modello serviranno come riferimento per lo studio di altre piante
• Il programma presenta obiettivi a corto-medio e lungo termine • Di quelli short-term molti sono già stati realizzati:
• Le annotazioni sul genoma sono incredibilmente aumentate attraverso l’uso di informazioni sulle sequenze espresse• Un ampio repertorio di mutanti sequenziati è stato creato ed è largamente utilizzato per la determinazione della funzione genica• Collezioni largamente rappresentative di sonde gene-specifiche sono state create e sono utilizzate per analisi d’espressione • Sequenze full-size di cDNA sono state definite per più del 60% di tutti i geni di Arabidopsis • Metodi per studi di metabolomica sono stati stabiliti• Le banche dati sono state largamente ampliate
• Dei 26.207 geni annotati, 16.138 sono rappresentati da un full-size cDNA, e per 20.901 (~80%) è stata studiata l’espressione. • Le risorse per studi di genomica funzionale sono aumentate: le database per mutanti inserzionali attualmente coprono inserzioni per 22.400 geni (~85% dei geni) che probabilmente corrispondono ad alleli KO per il 70% dei geni.
MASC 2004: update sulle funzioni geniche
Categorie: Per geni che codificano una proteina
attività della proteina/funzione molecolare Struttura terziaria
Dati di modificazioni post-traduzionaliProfilo di espressione proteico a livello
cellulare/tissutaleLocalizzazione subcellulareDati di interazione proteina/proteinaFenotipi di KO o alleli loss of functionProcessi biologici
Per geni che NON codificano una proteinaattività dell’RNA/prodotto genicoProfilo di espressione genico a livello
cellulare/tissutaleStruttura dell’RNA/prodotto genicoLocalizzazione subcellulare dell’RNA/ prodotto
genico Fenotipi di KO o alleli perdita di funzione (loss of
function)Dati di interazione
Il Gold Standard della caratterizzazione funzionale di un gene è raggiunto quando si hanno infos su tutti questi punti………….
Per vedere questa immagineoccorre QuickTime™ e un
decompressore Photo - JPEG.
13.000
26.207
20.901
Geni Identificati da dati Affy
Geni identificati da MPSS o
SAGE
Geni con ESTs
Geni con cDNAFull-length
Espressione
Dati d’espressione disponibili per circa l’80% di tutti i geni
Per vedere questa immagineoccorre QuickTime™ e un
decompressore Photo - JPEG.
12.750
20.498
26.207
ORFs
Geni con cloni ORFs già noti
Geni con cloni ORFs identificati
Per vedere questa immagineoccorre QuickTime™ e un
decompressore Photo - JPEG.
1.000
9.614
26.207
Funzione
Fenotipo mutante
Interazione genetica
Assay diretto
Interazione fisica
Funzione dedotta da:……….
Community Input di classe 3,2, & 1
Geni di cui:No omologie di sequenzaNo espressione dell’ORF
No isolamento cDNASolo predizione “We don’t know
anything about it”
Per vedere questa immagineoccorre QuickTime™ e un
decompressore Photo - JPEG.
1.976
26.207
• Il ruolo di Arabidopsis nel portare innovazione nella
biologia vegetale applicata, non va sottovalutato• Diversi geni di Arabidopsis, infatti, sono stati caratterizzati
funzionalmente e ne è stata poi dimostrata conservazione
funzionale in piante da raccolto mediante espressione
eterologa
Testare geni di Arabidopsis in piante da raccolto……..
Gigantea (GI): coinvolto nel controllo del flowering
mediante il fotoperiodo e nel controllo del ciclo circadiano.
La fioritura precoce è un problema per il “radish”:
espressione dell’antisenso di GI di Arabidopsis riduce i livelli
di GI endogeno, causando un ritardo di fioritura.
C-repeat/dehidration response element Binding Factor
(CBF1): Fattore di trascrizione di Arabidopsis che conferisce
tolleranza al freddo e allo stress ossidativo. Il pomodoro è
una pianta molto sensibile al freddo, viene resa resistente a
questo stress mediante espressione eterologa di CBF1.
Lo studio genetico del fotoperiodo nella pianta modello Arabidopsis fornisce una conoscenza fondamentale anche per le possibili applicazioni su piante da raccolto
La luce del giorno è un importante input ambientale per segnalare le condizioni favorevoli per la fioritura:
in Arabidopsis la fioritura è indotta da SDin riso la fioritura è indotta da LD
La chiave di volta di ciò è l’attività del FT CONSTANSIl valore adattativo del controllo del tempo di fioritura rivela un tratto importante da un punto di vista agronomicoLa possibilità di modificare il tempo di fioritura è la caratteristica più importante che regola la distribuzione geografica delle piante da raccolto
Transfer di conoscenze da Arabidopsis a piante da raccolto……..
Zea mays
Il genoma di mais è molto diverso da quello del suo antenato teosinte, e quindi è un interessante modello di evoluzione.3 linee di ricerca indipendenti cercano di far luce sulle basi molecolari di questa spettacolare trasformazione:
determinando la struttura del genoma di mais chiarendo il ruolo dei trasposoni nell’evoluzione di questo genoma investigando sulle basi molecolari delle differenze morfologiche fra mais e teosinte
Finanziata nel ’98
Identificazione dei geni di mais usando due approcci complementari:
• ESTs• Sequencing le FS delle inserzioni del trasposone Mutator
GOALS:
Obiettivo finale:Sequencing di 150.000 segmenti di DNA genomico da inserzioni MuSe il mais ha 50.000 geni
probabilità 95% di sequenza ogni gene 1X<
Maize Genetics and Genomics Database
Oryza sativaPianta modello per i cereali
Di alto interesse agronomico
IRGSP: International Rice Genome Sequencing ProjectConsorzio di laboratori di:Asia, Europa, Nord e Sud AmericaGenoma completamente sequenziato nel 2002Comparazione strutturale e funzionale con il genoma di mais
The Golden Rice ProjectNegli anni ‘90 finanziato dalla Fondazione Rockefeller (Rockefeller Biotechnology Program) un progetto per “ingegnerizzare il pathway della provitamina-A nell’ endosperma di riso”. Il progetto fu giudicato a bassa probabilità di successo ma meritevole in quanto potenzialmente di grande utilitàIl progetto è stato svolto e realizzato COMPLETAMENTE in strutture Accademiche:
I. Potrykus, Inst. of Plant Sciences, Swiss Fed.Inst.of Technology, ETH-Zurich,Switz.
P. Beyer, University of Freiburg, Germany
This rice could save a million
kids a year