Upload
herbert-bayer
View
222
Download
0
Embed Size (px)
Citation preview
6. Vorlesung
3. Genregulation (Phänomene und Datenquellen)
Eigenschaften metabolischer Prozesse
Genexpression
Genwirkketten
Modellierung des Promotors
Vorlesung Modellierung & Simulation Überblick
Ergebnis: Die DNA zeigt auf der Ebene der analysierten Strukturen komplexe Sprachkonstrukte.
Zusammenfassende Darstellung der Eigenschaften:
1. Genom ist modular
Anweisungen und Module können überlappen.
2. Metabolismus ist probabilistisch
Operationsstärke einer 'elementar anwendbaren Anweisung‘.
3. Genom ist dynamisch
Transposon, Genfähre, Rekombination und Mutation.Vorlesung Modellierung & Simulation 3. Genregulation
4. Simultane Aktivierung
Nebenläufige Genexpression und katalyse.
5. Granularität der genetischen Prozesse
Konzentration der Proteine etc. ist variabel.
6. Datenfluss
Daten und Kontrollanweisungen steuern den Programmfluß.
7. Der genetische Speicher ist kein adressierbarer Raum.
Genom repräsentiert auch evolutionärer Redundanz.
Vorlesung Modellierung & Simulation 3. Genregulation
Modellierung der Genexpression
1944 Transformationsversuche
DNA Träger der genetischen Information
1953 Watson und Crick
Modell der DNA
1963 Jacob und Monod
Modell der Genregulation
60er
Genetischer Code
Vorlesung Modellierung & Simulation 3. Genregulation
Gen = Cistron (moderner Genbegriff)
DNA-Abschnitt, der sich aus linear verknüpften Nukleotiden zusammensetzt und eine biochemische Funktion repräsentiert.
Strukturgen
DNA-Abschnitte, die in die primäre mRNA übersetzt werden (Transkription).
Promotorgen
DNA-Abschnitt mit Affinität zur RNA-Polymerase.
Vorlesung Modellierung & Simulation 3. Genregulation
Transkription:
1. Genetischer Code:
Triplets werden nichtüberlappend und
kommafrei übersetzt.
2. Genetischer Code:
Jedes tRNA Molekül trägt eine spezifische
Aminosäure.
Vorlesung Modellierung & Simulation 3. Genregulation
Operatorgene
DNA-Abschnitt mit Affinität zu Regulatorproteinen.
Terminatorgene
DNA-Abschnitt zur Beendigung der Transkription.
Regulatorgen
DNA-Abschnitt codiert für ein Regulatorgen.
Vorlesung Modellierung & Simulation 3. Genregulation
Induktives System
Substrat inaktiviert den spezifischen Repressor direkt oder indirekt.
Repressives System
Regulatorgen codiert einen inaktiven Repressor, der erst durch Bindung eines Endproduktes einer Biosynthesekette aktiv wird.
Vorlesung Modellierung & Simulation 3. Genregulation
PromotorPromotor OperatorOperator StrukturgenStrukturgen TerminatorTerminator RegulatorRegulator
Docking / Repressor
Enzym
tRNA
rRNA
Proteine
Transkription Stop
Transkription Start microRNAAntisenseRNAsiRNA
Promotor Operator Strukturgen SPromotor Operator Strukturgen S11 S S22 S S33 Terminator Terminator Regulator Regulator
Transkription
mRNA (primär)
SplicenmRNA (sekundär)
Translation
Enzyme E1 E3E2Biosynthese
Substrat/Produkt-kette
Genwirkkette
Promotor Operator Strukturgen SPromotor Operator Strukturgen S11 S S22 S S33 Terminator Terminator Regulator Regulator
E1 E3E2
S P
Induktives System
Substrat deaktiviert Repressor !
Promotor Operator Strukturgen SPromotor Operator Strukturgen S11 S S22 S S33 Terminator Terminator Regulator Regulator
E1 E3E2
S P
Repressives System
Produkt aktiviert Repressor !
Klassisches Modell der Genregulation
Grundlegend: Lac Operon (Jacob und Monod)
Auf der Ebene der Transkription wird die Genregulation bruchstückhaft verstanden.
Offene Frage: Kinetik der Genregulation:
Wie häufig wird ein Strukturgen übersetzt ?
Wie häufig wird ein Protein synthetisiert ?
Vorlesung Modellierung & Simulation 3. Genregulation
Zur Klärung dieser Fragen:
- Konzentration der RNA-Polymerase,
- DNA Sequenzen (Enhancer, Promotor etc.) legen die Affinität zwischen RNA Polymerase und Promotor fest,
- Lebensdauer der mRNA,
- Rolle der RNA,
- Anzahl der Ribosomen,
- Affinität mRNA/Ribosom und
- Affinität DNA/Induktor/Repressor.
Phänomen der Genregulation !?
Vorlesung Modellierung & Simulation 3. Genregulation
Verschiedene Ebenen der Genregulation:
Struktur der DNA (Topoisomerase)
DNA auf Histone und Nichthistone aufgewickelt, die in ihrer Struktur veränderbar sind (Methylierung, Acetylierung und Phosphorylierung).
Topoisomerase – Modifikation des Verdrillungsgrades
Granularität (RNA-Polymerase etc.)
Genetische Information der RNA etc. unterliegt der Genregulation.
Vorlesung Modellierung & Simulation 3. Genregulation
Verschiedene Ebenen der Genregulation:
Transkription
Fundamentale Ebene der Genregulation (Promotoraffinität).
RNA - Antisense RNA
Transkription auf Mutterstrang – Sense Strang (komplementär: Antisense).
Splicen
LebensdauerDie mRNA hat unterschiedliche Lebensdauern: Minuten bis Tage.
Vorlesung Modellierung & Simulation 3. Genregulation
Translation
Affinität zu den Ribosomen.
Amplifikation
Zellstoffwechsel benötigt hohe Konzentration spezifischer Substanzen:
Vervielfachung der Baupläne
Attenuation (Abschwächung)
Translation biochemisch bremsen.
Vorlesung Modellierung & Simulation 3. Genregulation
Ebene der Transkription:
Mensch: ca. 30.000 Strukturgene
Komplexe Promotorsequenzen: Transkriptionsfaktoren
Promotoraffinität: Enhancer
Komplexe Gensteuerung: Homöogene (Bsp. Taufliege)
Fundamental: Lac-Operon bei E. coli
Vorlesung Modellierung & Simulation 3. Genregulation
Lactoseverwertung
Lactose
(außerhalb der Zelle)
Lactose
(innerhalb der Zelle) Galactose
Glucose
Lactose-Permease (Y)-Galactosidase +
Transacetylase (Z)
P P Strukturgene: lacZ lac Y lac A Strukturgene: lacZ lac Y lac A TT
Lac-Operon und sein Regulationsgen lacI
mRNAlacZ lacY lacA
LacI lacZ lacY lacAPP T PT P TT
O
Lac-Operon und seine Regulation
LacI lacZ lacY lacAPP T PT P TT
O
Operator
Promotor
mRNA
lac-Repressor
PP T T TT
RNA-PolymeraseKann nicht binden
OP
Lac-Operon und seine Regulation
PP T PT P TT
O
PP T PT P TT
O
LacI lacZ lacY lacA
mRNAlac-Repressor
Allolactose
Repressorinaktiv
RNA-Polymerasekann binden
Transkription
mRNA
viele Lactose-
moleküle
alle Repressormoleküle haben
Allolactose gebunden
mäßige Menge an Lactosemoleküle
nur wenige Repressormoleküle haben Allolactose gebunden
sehr wenig Lactosemoleküle kein Repressor hat Allolactose gebunden
Ende von
lacI
CAP-Bindung Operator
Promotor
-35 -10
Beginn von
lacZ
Glucose hemmt die cAMP-Synthese
ATP
AdeninAdenylcyclase
Glucose hemmt
Adenin
zyklisches AMP
CAP-cAMP stimuliert die Transkription
P
O
CAP-Bindungsstelle
frei
lac-mRNA
P
O
CAP-cAMP
lac-mRNA
Niedriger Glucosespiegel
Aktivierung der Transkription
P
O
lac-mRNA
P
O
CAP-cAMP
lac-mRNA
Aktivierung der Transkription
Glucose
LactoseNiedriger cAMP-Spiegel,
CAP-Stelle frei
Glucose wird zuerst verbraucht
lacZ
lacZ
hoher cAMP-Spiegel,
CAP-Stelle besetzt
Sequenzanalyse und Genregulation
DNA-Sequenz = Wort über dem Alphabet {A,T(U),G,C}.
= Folge von Zeichen (characters), deren Länge zwischen 1 und ca. 200.000 variieren kann.
Durchschnittliche Länge (Datenbank) ca. 1000 Basen.
Sind immer alle Basen einer Sequenz bekannt ?
Mehrdeutigkeiten erfassen: Erweiterung des Arbeitsalphabets.
Vorlesung Modellierung & Simulation 3. Genregulation
SymbolSymbol BedeutungBedeutung SymbolSymbol BedeutungBedeutung
Y C oder T M A oder C
W A oder T H A oder T oder C
S G oder C K G oder T
B G oder T oder C R G oder A
V G oder A oder C D G oder A oder T
X G oder A oder T . Lücke
oder C
Tabelle. Das Arbeitsalphabet IUPAC setzt sich aus den Basen und den hier dargestellten Zeichen zusammen.
SymbolSymbol BedeutungBedeutung SymbolSymbol BedeutungBedeutung
B A oder AA D C oder CC
H G oder GG V T oder TT
K C oder CX L T oder TX
M A oder AX N G oder GX
R A oder G Y C oder T
X A oder G oder T - A oder G oder T
oder C oder C
1 Lücke oder C 2 Lücke oder T
3 Lücke oder A 4 Lücke oder G
5 A oder C 6 G oder T
7 A oder T 8 C oder G
Tabelle: Basenbezeichnung nach Roger Staden
Jeder Forscher ist bemüht, diese Mehrdeutigkeiten bei der Aufklärung der Sequenzen zu beseitigen.
Der internationale Mehrdeutigkeitscode beansprucht 4 Bits:
BitsequenzBitsequenz SymbolSymbol BitsequenzBitsequenz SymbolSymbol
0000 . 1000 A
0001 T/U 1001 W
0010 G 1010 R
0011 K 1011 D
0100 C 1100 M
0101 Y 1101 H
0110 S 1110 V
0111 B 1111 X/N
Sequenzanalyse und Probleme der EDV:
- Einsatz der unterschiedlichen Datenformate,
- Benutzung verschiedener Codes und
- Fehlerraten.
1. Schritt: Lesen des Gels – automatische Ermittlung der Sequenz
Konflikte (2 x lesen) markieren und vom Benutzer oder per Nachsequenzierung klären.
Grundregel:
Man erlaubt eine ca. 1%ige Fehlerrate pro Fragment.
Sequenz ?
DNA-Funktionseinheiten ermitteln. Vorlesung Modellierung & Simulation 3. Genregulation
2. Schritt: Automatische Identifizierung der Funktionseinheiten
Zentrale Frage: Identifizierung der Transkriptionseinheiten
Statistische Methoden
charakteristische Sequenzen
Konsensus-Sequenz.
Solche Sequenzen extrahieren aus:
- Literatur oder
- Datenbanken (z.B. TRANSFAC).
Heuristiken sind erforderlich !
Vorlesung Modellierung & Simulation 3. Genregulation
Beispiel: Identifizierung von Transkriptionseinheit
Algorithmische Identifikation – naiver Ansatz:
Identifikation der Start- und Stopptripletts;
Identifikation der Intron/Exon-Grenzen;
Identifikation der Promotoren;
Identifikation der Terminatorsequenzen;
Identifikation der Shine-Dalgarno-Sequenz.
Identifikation dieser Strukturen ausreichend ?
Vorlesung Modellierung & Simulation 3. Genregulation
Prokaryonten: Hier ist die automatische Identifikation der Promotoren leichter, weil die bereits sequenzierten Promotoren statistisch eine recht einheitliche Sequenz aufweisen.
Eukaryonten: Hier kennt man eine Vielzahl von Signalen, die in einer unüberschaubaren Kombination
auftreten.
RNA-Polymerase von Prokaryonten unterteilt sich in:
- Sigmafaktor und
- Core-Enzym.
Sigmafaktor identifiziert den Promotor.Vorlesung Modellierung & Simulation 3. Genregulation
Sigmafaktoren, die verschiedene Promotorklassen erkennen:
1. RNA-Polymerase bindet locker an einen beliebigen Teil der DNA und wandert von dort aus den Strang entlang, bis ein Promotor gefunden wird, an dem dann eine feste Bindung stattfindet.
2. Sigmafaktor nur an der Initiation beteiligt. Für die Elongation wird dieser von dem Core-Enzym abgelöst, damit eine lockere Bindung an der folgenden DNA-Sequenz möglich ist.
3. RNA-Polymerase ohne Sigmafaktor - wandert die DNA entlang, bis ein Stoptriplett auftritt. Dann löst sich auch das Core-Enzym von der DNA und vereinigt sich erneut mit dem freiliegenden Sigmafaktor zum Holoenzym.
Woran erkennt der Sigmafaktor nun den Promotor ?
Jeder Promotor hat spezifische Subsequenzen !
Vorlesung Modellierung & Simulation 3. Genregulation
Mindestlänge der Subsequenzen ?
Solche Signale kommen in allen Promotoren vor; deshalb bezeichnet man sie auch als konserviert.
Überlagerung aller bekannten Promotoren
Konsensus-Sequenz ablesen.
Nur wenige Promotoren entsprechen der exakten Struktur der Konsensus-Sequenzen, aber als Faustregel gilt:
Je ähnlicher die jeweiligen Promotorabschnitte den Konsensus-Sequenzen sind, desto stärker ist der Promotor und umgekehrt.
Vorlesung Modellierung & Simulation 3. Genregulation
Sequenzvergleich bei Prokaryonten hat an zwei Stellen eine Konsensus-Sequenz identifiziert:
- 10 Nukleotidepaare stromaufwärts vom Transkriptionsstart (+1) liegt eine Sequenz von 6 Nukleotiden, die große Ähnlichkeit mit der Folge 5-TATAAT-3 aufweist, die auch als Pribnow-Box bezeichnet wird.
- An der Position -35, mitten in einem AT-reichen Abschnitt, liegt meistens die Folge 5-TTGACA-3.
Muster-Promotor des E-coli Genoms aufstellen:
Position: -35 -10 +1
Sinnstrang 5’ TCTTGACA--- TATAAT-- CAT-- 3’
Gegenstrang 3’ AGAACTGT-- ATATTA-- GTA-- 5’
Prominenteste Bindungsstelle: Pribnow Box
Stormo: Veranschaulichung der Problematik
Pribnow gibt die folgenden Bindungssequenzen an:
TACGAT
TATAAT
TGTAAT
GATACT
TATGAT
TATGTT
Konsensus-Sequenz: TATAAT
Vorlesung Modellierung & Simulation 3. Genregulation
Statistik – Auftreten dieser Sequenz im Genom:
Konsensus-Sequenz: TATAAT
1. Gleichverteilung der Basen: 4096 bp
2. 1x Mismatch zulassen: 170 bp
3. 2x Mismatches zulassen: 34 bp
Verwendung von TATRNT
Mismatch zulassen: 28 bp
Stormo (2000)
Vorlesung Modellierung & Simulation 3. Genregulation