39
6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors Vorlesung Modellierung & Simulation Überblick

6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Embed Size (px)

Citation preview

Page 1: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

6. Vorlesung

3. Genregulation (Phänomene und Datenquellen)

Eigenschaften metabolischer Prozesse

Genexpression

Genwirkketten

Modellierung des Promotors

Vorlesung Modellierung & Simulation Überblick

Page 2: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Ergebnis: Die DNA zeigt auf der Ebene der analysierten Strukturen komplexe Sprachkonstrukte.

Zusammenfassende Darstellung der Eigenschaften:

1. Genom ist modular

Anweisungen und Module können überlappen.

2. Metabolismus ist probabilistisch

Operationsstärke einer 'elementar anwendbaren Anweisung‘.

3. Genom ist dynamisch

Transposon, Genfähre, Rekombination und Mutation.Vorlesung Modellierung & Simulation 3. Genregulation

Page 3: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

4. Simultane Aktivierung

Nebenläufige Genexpression und katalyse.

5. Granularität der genetischen Prozesse

Konzentration der Proteine etc. ist variabel.

6. Datenfluss

Daten und Kontrollanweisungen steuern den Programmfluß.

7. Der genetische Speicher ist kein adressierbarer Raum.

Genom repräsentiert auch evolutionärer Redundanz. 

Vorlesung Modellierung & Simulation 3. Genregulation

Page 4: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Modellierung der Genexpression

1944 Transformationsversuche

DNA Träger der genetischen Information

1953 Watson und Crick

Modell der DNA

1963 Jacob und Monod

Modell der Genregulation

60er

Genetischer Code

Vorlesung Modellierung & Simulation 3. Genregulation

Page 5: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Gen = Cistron (moderner Genbegriff)

DNA-Abschnitt, der sich aus linear verknüpften Nukleotiden zusammensetzt und eine biochemische Funktion repräsentiert.

Strukturgen

DNA-Abschnitte, die in die primäre mRNA übersetzt werden (Transkription).

Promotorgen

DNA-Abschnitt mit Affinität zur RNA-Polymerase.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 6: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Transkription:

1. Genetischer Code:

Triplets werden nichtüberlappend und

kommafrei übersetzt.

2. Genetischer Code:

Jedes tRNA Molekül trägt eine spezifische

Aminosäure.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 7: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Operatorgene

DNA-Abschnitt mit Affinität zu Regulatorproteinen.

Terminatorgene

DNA-Abschnitt zur Beendigung der Transkription.

Regulatorgen

DNA-Abschnitt codiert für ein Regulatorgen.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 8: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Induktives System

Substrat inaktiviert den spezifischen Repressor direkt oder indirekt.

Repressives System

Regulatorgen codiert einen inaktiven Repressor, der erst durch Bindung eines Endproduktes einer Biosynthesekette aktiv wird.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 9: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

PromotorPromotor OperatorOperator StrukturgenStrukturgen TerminatorTerminator RegulatorRegulator

Docking / Repressor

Enzym

tRNA

rRNA

Proteine

Transkription Stop

Transkription Start microRNAAntisenseRNAsiRNA

Page 10: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Promotor Operator Strukturgen SPromotor Operator Strukturgen S11 S S22 S S33 Terminator Terminator Regulator Regulator

Transkription

mRNA (primär)

SplicenmRNA (sekundär)

Translation

Enzyme E1 E3E2Biosynthese

Substrat/Produkt-kette

Genwirkkette

Page 11: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Promotor Operator Strukturgen SPromotor Operator Strukturgen S11 S S22 S S33 Terminator Terminator Regulator Regulator

E1 E3E2

S P

Induktives System

Substrat deaktiviert Repressor !

Page 12: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Promotor Operator Strukturgen SPromotor Operator Strukturgen S11 S S22 S S33 Terminator Terminator Regulator Regulator

E1 E3E2

S P

Repressives System

Produkt aktiviert Repressor !

Page 13: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Klassisches Modell der Genregulation

Grundlegend: Lac Operon (Jacob und Monod)

Auf der Ebene der Transkription wird die Genregulation bruchstückhaft verstanden.

Offene Frage: Kinetik der Genregulation:

Wie häufig wird ein Strukturgen übersetzt ?

Wie häufig wird ein Protein synthetisiert ?

Vorlesung Modellierung & Simulation 3. Genregulation

Page 14: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Zur Klärung dieser Fragen:

- Konzentration der RNA-Polymerase,

- DNA Sequenzen (Enhancer, Promotor etc.) legen die Affinität zwischen RNA Polymerase und Promotor fest,

- Lebensdauer der mRNA,

- Rolle der RNA,

- Anzahl der Ribosomen,

- Affinität mRNA/Ribosom und

- Affinität DNA/Induktor/Repressor.

Phänomen der Genregulation !?

Vorlesung Modellierung & Simulation 3. Genregulation

Page 15: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Verschiedene Ebenen der Genregulation:

Struktur der DNA (Topoisomerase)

DNA auf Histone und Nichthistone aufgewickelt, die in ihrer Struktur veränderbar sind (Methylierung, Acetylierung und Phosphorylierung).

Topoisomerase – Modifikation des Verdrillungsgrades

Granularität (RNA-Polymerase etc.)

Genetische Information der RNA etc. unterliegt der Genregulation.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 16: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Verschiedene Ebenen der Genregulation:

Transkription

Fundamentale Ebene der Genregulation (Promotoraffinität).

RNA - Antisense RNA

Transkription auf Mutterstrang – Sense Strang (komplementär: Antisense).

Splicen

LebensdauerDie mRNA hat unterschiedliche Lebensdauern: Minuten bis Tage.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 17: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Translation

Affinität zu den Ribosomen.

Amplifikation

Zellstoffwechsel benötigt hohe Konzentration spezifischer Substanzen:

Vervielfachung der Baupläne

Attenuation (Abschwächung)

Translation biochemisch bremsen.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 18: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Ebene der Transkription:

Mensch: ca. 30.000 Strukturgene

Komplexe Promotorsequenzen: Transkriptionsfaktoren

Promotoraffinität: Enhancer

Komplexe Gensteuerung: Homöogene (Bsp. Taufliege)

Fundamental: Lac-Operon bei E. coli

Vorlesung Modellierung & Simulation 3. Genregulation

Page 19: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Lactoseverwertung

Lactose

(außerhalb der Zelle)

Lactose

(innerhalb der Zelle) Galactose

Glucose

Lactose-Permease (Y)-Galactosidase +

Transacetylase (Z)

Page 20: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

P P Strukturgene: lacZ lac Y lac A Strukturgene: lacZ lac Y lac A TT

Lac-Operon und sein Regulationsgen lacI

mRNAlacZ lacY lacA

LacI lacZ lacY lacAPP T PT P TT

O

Page 21: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Lac-Operon und seine Regulation

LacI lacZ lacY lacAPP T PT P TT

O

Operator

Promotor

mRNA

lac-Repressor

PP T T TT

RNA-PolymeraseKann nicht binden

OP

Page 22: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Lac-Operon und seine Regulation

PP T PT P TT

O

PP T PT P TT

O

LacI lacZ lacY lacA

mRNAlac-Repressor

Allolactose

Repressorinaktiv

RNA-Polymerasekann binden

Transkription

mRNA

Page 23: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

viele Lactose-

moleküle

alle Repressormoleküle haben

Allolactose gebunden

mäßige Menge an Lactosemoleküle

nur wenige Repressormoleküle haben Allolactose gebunden

sehr wenig Lactosemoleküle kein Repressor hat Allolactose gebunden

Page 24: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Ende von

lacI

CAP-Bindung Operator

Promotor

-35 -10

Beginn von

lacZ

Glucose hemmt die cAMP-Synthese

ATP

AdeninAdenylcyclase

Glucose hemmt

Adenin

zyklisches AMP

Page 25: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

CAP-cAMP stimuliert die Transkription

P

O

CAP-Bindungsstelle

frei

lac-mRNA

P

O

CAP-cAMP

lac-mRNA

Niedriger Glucosespiegel

Aktivierung der Transkription

Page 26: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

P

O

lac-mRNA

P

O

CAP-cAMP

lac-mRNA

Aktivierung der Transkription

Glucose

LactoseNiedriger cAMP-Spiegel,

CAP-Stelle frei

Glucose wird zuerst verbraucht

lacZ

lacZ

hoher cAMP-Spiegel,

CAP-Stelle besetzt

Page 27: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Sequenzanalyse und Genregulation

DNA-Sequenz = Wort über dem Alphabet {A,T(U),G,C}.

= Folge von Zeichen (characters), deren Länge zwischen 1 und ca. 200.000 variieren kann.

Durchschnittliche Länge (Datenbank) ca. 1000 Basen.

Sind immer alle Basen einer Sequenz bekannt ?

Mehrdeutigkeiten erfassen: Erweiterung des Arbeitsalphabets.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 28: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

 

SymbolSymbol BedeutungBedeutung SymbolSymbol BedeutungBedeutung

Y C oder T M A oder C

W A oder T H A oder T oder C

S G oder C K G oder T

B G oder T oder C R G oder A

V G oder A oder C D G oder A oder T

X G oder A oder T . Lücke

oder C

Tabelle. Das Arbeitsalphabet IUPAC setzt sich aus den Basen und den hier dargestellten Zeichen zusammen.

Page 29: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

SymbolSymbol BedeutungBedeutung SymbolSymbol BedeutungBedeutung

B A oder AA D C oder CC

H G oder GG V T oder TT

K C oder CX L T oder TX

M A oder AX N G oder GX

R A oder G Y C oder T

X A oder G oder T - A oder G oder T

oder C oder C

1 Lücke oder C 2 Lücke oder T

3 Lücke oder A 4 Lücke oder G

5 A oder C 6 G oder T

7 A oder T 8 C oder G

Tabelle: Basenbezeichnung nach Roger Staden

Page 30: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Jeder Forscher ist bemüht, diese Mehrdeutigkeiten bei der Aufklärung der Sequenzen zu beseitigen.

Der internationale Mehrdeutigkeitscode beansprucht 4 Bits:

BitsequenzBitsequenz SymbolSymbol BitsequenzBitsequenz SymbolSymbol

0000 . 1000 A

0001 T/U 1001 W

0010 G 1010 R

0011 K 1011 D

0100 C 1100 M

0101 Y 1101 H

0110 S 1110 V

0111 B 1111 X/N

Page 31: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Sequenzanalyse und Probleme der EDV:

- Einsatz der unterschiedlichen Datenformate,

- Benutzung verschiedener Codes und

- Fehlerraten.

1. Schritt: Lesen des Gels – automatische Ermittlung der Sequenz

Konflikte (2 x lesen) markieren und vom Benutzer oder per Nachsequenzierung klären.

Grundregel:

Man erlaubt eine ca. 1%ige Fehlerrate pro Fragment.

Sequenz ?

DNA-Funktionseinheiten ermitteln. Vorlesung Modellierung & Simulation 3. Genregulation

Page 32: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

2. Schritt: Automatische Identifizierung der Funktionseinheiten

Zentrale Frage: Identifizierung der Transkriptionseinheiten

Statistische Methoden

charakteristische Sequenzen

Konsensus-Sequenz.

Solche Sequenzen extrahieren aus:

- Literatur oder

- Datenbanken (z.B. TRANSFAC).

Heuristiken sind erforderlich !

Vorlesung Modellierung & Simulation 3. Genregulation

Page 33: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Beispiel: Identifizierung von Transkriptionseinheit

Algorithmische Identifikation – naiver Ansatz:

    Identifikation der Start- und Stopptripletts;

    Identifikation der Intron/Exon-Grenzen;

    Identifikation der Promotoren;

    Identifikation der Terminatorsequenzen;

    Identifikation der Shine-Dalgarno-Sequenz.

Identifikation dieser Strukturen ausreichend ?

Vorlesung Modellierung & Simulation 3. Genregulation

Page 34: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Prokaryonten: Hier ist die automatische Identifikation der Promotoren leichter, weil die bereits sequenzierten Promotoren statistisch eine recht einheitliche Sequenz aufweisen.

Eukaryonten: Hier kennt man eine Vielzahl von Signalen, die in einer unüberschaubaren Kombination

auftreten.

RNA-Polymerase von Prokaryonten unterteilt sich in:

- Sigmafaktor und

- Core-Enzym.

Sigmafaktor identifiziert den Promotor.Vorlesung Modellierung & Simulation 3. Genregulation

Page 35: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Sigmafaktoren, die verschiedene Promotorklassen erkennen:

1. RNA-Polymerase bindet locker an einen beliebigen Teil der DNA und wandert von dort aus den Strang entlang, bis ein Promotor gefunden wird, an dem dann eine feste Bindung stattfindet.

2. Sigmafaktor nur an der Initiation beteiligt. Für die Elongation wird dieser von dem Core-Enzym abgelöst, damit eine lockere Bindung an der folgenden DNA-Sequenz möglich ist.

3. RNA-Polymerase ohne Sigmafaktor - wandert die DNA entlang, bis ein Stoptriplett auftritt. Dann löst sich auch das Core-Enzym von der DNA und vereinigt sich erneut mit dem freiliegenden Sigmafaktor zum Holoenzym.

Woran erkennt der Sigmafaktor nun den Promotor ?

Jeder Promotor hat spezifische Subsequenzen !

Vorlesung Modellierung & Simulation 3. Genregulation

Page 36: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Mindestlänge der Subsequenzen ?

Solche Signale kommen in allen Promotoren vor; deshalb bezeichnet man sie auch als konserviert.

Überlagerung aller bekannten Promotoren

Konsensus-Sequenz ablesen.

Nur wenige Promotoren entsprechen der exakten Struktur der Konsensus-Sequenzen, aber als Faustregel gilt:

Je ähnlicher die jeweiligen Promotorabschnitte den Konsensus-Sequenzen sind, desto stärker ist der Promotor und umgekehrt.

Vorlesung Modellierung & Simulation 3. Genregulation

Page 37: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Sequenzvergleich bei Prokaryonten hat an zwei Stellen eine Konsensus-Sequenz identifiziert:

- 10 Nukleotidepaare stromaufwärts vom Transkriptionsstart (+1) liegt eine Sequenz von 6 Nukleotiden, die große Ähnlichkeit mit der Folge 5-TATAAT-3 aufweist, die auch als Pribnow-Box bezeichnet wird.

- An der Position -35, mitten in einem AT-reichen Abschnitt, liegt meistens die Folge 5-TTGACA-3.

Muster-Promotor des E-coli Genoms aufstellen:

Position:   -35 -10 +1

Sinnstrang 5’ TCTTGACA--- TATAAT-- CAT-- 3’

Gegenstrang 3’ AGAACTGT-- ATATTA-- GTA-- 5’

Page 38: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Prominenteste Bindungsstelle: Pribnow Box

Stormo: Veranschaulichung der Problematik

Pribnow gibt die folgenden Bindungssequenzen an:

TACGAT

TATAAT

TGTAAT

GATACT

TATGAT

TATGTT

Konsensus-Sequenz: TATAAT

Vorlesung Modellierung & Simulation 3. Genregulation

Page 39: 6. Vorlesung 3. Genregulation (Phänomene und Datenquellen) Eigenschaften metabolischer Prozesse Genexpression Genwirkketten Modellierung des Promotors

Statistik – Auftreten dieser Sequenz im Genom:

Konsensus-Sequenz: TATAAT

1. Gleichverteilung der Basen: 4096 bp

2. 1x Mismatch zulassen: 170 bp

3. 2x Mismatches zulassen: 34 bp

Verwendung von TATRNT

Mismatch zulassen: 28 bp

Stormo (2000)

Vorlesung Modellierung & Simulation 3. Genregulation