Regul are Sprachen - LMU

Formale Sprachen und KomplexitatSommersemester 2019

Regulare Sprachen: Formalismen

Prof. Dr. David Sabel

LFE Theoretische Informatik

Letzte Anderung der Folien: 4. Juni 2019

Regulare Sprachen

Wiederholung:

Eine Sprache heißt regular (bzw. vom Typ 3), wenn sie voneiner Typ 3-Grammatik erzeugt wird.

Eine Grammatik G = (V,Σ, P, S) ist vom Typ 3(bzw. regular), wenn alle Produktionen von der Form

A→ a oder A→ aB

mit A,B ∈ V und a ∈ Σ sind.

TCS | 02 Regulare Sprachen (I) | SoSe 2019 2/58 DFAs NFAs NFAs+ε Regulare Ausdrucke Zusammenf.

Inhaltsubersicht

Deterministische endliche Automaten

Nichtdeterministische endliche Automaten

Regulare Ausdrucke

Aquivalenz der Formalismen

Deterministische endliche Automaten

Die informelle Kurzfassung:

Endliche Automaten lesen Zeichenweise ein Eingabewort

Wechseln dabei den Zustand (eindeutig)

Nur endlich viele Zustande

Starten im Startzustand

Nach Lesen der Eingabe: Akzeptieren oder Verwerfen

Akzeptieren = in einem Endzustand

Verwerfen = in keinem Endzustand

Akzeptierte Sprache = alle Worte, fur die der Automatakzeptiert

DFA: Definition

Definition (Deterministischer Endlicher Automat, DFA)

Ein deterministischer endlicher Automat (determinististic finiteautomaton, DFA) ist ein 5-Tupel M = (Z,Σ, δ, z0, E) wobei

Z ist eine endliche Menge von Zustanden,

Σ ist das (endliche) Eingabealphabet mit (Z ∩ Σ) = ∅,z0 ∈ Z ist der Startzustand,

E ⊆ Z ist die Menge der Endzustande (oder auchakzeptierende Zustande) und

δ : Z × Σ→ Z ist die Zustandsuberfuhrungsfunktion (odernur Uberfuhrungsfunktion).

Zustandsgraph eines DFA

Fur DFA M = (Z,Σ, δ, z0, E)

Fur z ∈ Z gibt es Knoten z

Startzustand z0 ∈ Z: eingehender Pfeil z0 ,

Endzustande z ∈ E: doppelte Kreise z ,

Ubergange δ(zi, a) = zj als Kante zi zja

und statt zi zj

zeichnen wir zi zja, b

BeispielDFA M = ({z0, z1, z2}, {a, b}, δ, z0, {z2}) mit

δ(z0, a) = z1 δ(z1, b) = z0δ(z0, b) = z0 δ(z2, a) = z2δ(z1, a) = z2 δ(z2, b) = z2

z0z0z0 z1z1 z2z2z2

a, ba, b

Abarbeitung von abbaaa:

Starte in z0

Lese a und wechsle in z1

Lese b und wechsle in z0

Akzeptiere

Abarbeitung von bbab:

Starte in z0

Verwerfe

Akzeptierte Spraches eines DFA

Definition (Akzeptierte Sprache eines DFA)

Sei M = (Z,Σ, δ, z0, E) ein DFA.Wir definieren die Funktion δ : Z × Σ∗ → Z durch

δ(z, ε) := z und δ(z, aw) := δ(δ(z, a), w)

Die von M akzeptierte Sprache ist

L(M) := {w ∈ Σ∗ | δ(z0, w) ∈ E}.

δ wendet δ solange an, bis das Eingabewort abgearbeitet ist

Beispiel

DFA M = ({z0, z1, z2}, {a, b}, δ, z0, {z2}) mit

z0 z1 z2

L(M) = {uaav | uv ∈ {a, b}∗}

Beispiel: DFA konstruieren

Konstruiere DFA uber Σ = {a, b} der alle Worte akzeptiert, die mitabaa beginnen und mit bab enden:

z0 z1 z2 z3 z4

z6 z7 z8

a b a a

b a b b

Beispiel: DFA konstruieren (2)

Zusatzlich die Worter a und ab akzeptieren

z0 z1 z2 z3 z4

z6 z7 z8

a b a a

b a b b

Definition

Sei M = (Z,Σ, δ, z0, E) ein DFA und w ∈ Σ∗ mit |w| = n.Die Folge von Zustanden q0, . . . , qn mit q0 = z0 undqi = δ(qi−1, w[i]) bezeichnet man als Lauf von M fur Wort w.

Fur eine solchen Lauf schreiben wir auch:

q0w[1]−−→ q1

w[2]−−→ · · · w[n−1]−−−−→ qn−1w[n]−−→ qn

DFAs akzeptieren regulare Sprachen

Theorem 4.2.1

Sei M = (Z,Σ, δ, z0, E) ein DFA. Dann ist L(M) regular.

Beweis: Sei G = (V,Σ, P, S) die regulare Grammatik mit

V = Z, S = z0, P = {zi → azj | δ(zi, a) = zj}∪ {zi → a | δ(zi, a) = zj ∧ zj ∈ E}∪ {z0 → ε | falls z0 ∈ E}

Offensichtlich ε ∈ L(M) ⇐⇒ ε ∈ L(G). Ansonsten:w = a1 · · · am ∈ L(M)

g.d.w. es gibt z1, . . . , zm ∈ Z mit δ(zi−1, ai) = zi und zm ∈ E.g.d.w. z0 ⇒G a1z1, fur 1 ≤ i < m: a1 · · · ai−1zi−1 ⇒G a1 · · · aizi und

a1 · · · am−1zm−1 ⇒G a1 · · · am, d.h. z0 ⇒∗G a1 · · · amg.d.w. w = a1 · · · am ∈ L(G)

Daher gilt L(M) = L(G) und somit ist L(M) regular.

Beispiel: Konstruktion Typ 3-Grammatik aus DFA

DFA M = ({z0, z1, z2}, {a, b}, δ, z0, {z2}) mit

z0 z1 z2

Die erzeugte regulare Grammatik dazu ist:

G = ({z0, z1, z2}, {a, b}, P, z0) mitP = {z0 → az1 | bz0,

z1 → az2 | a | bz0,z2 → az2 | a | bz2 | b}

Wird jede regulare Sprache durch einen DFA akzeptiert?

Der vorherige Beweis konstruiert:

”fur jeden DFA gibt es eine aquivalente regulare Grammatik“

Fur die andere Richtung ware notwendig

”fur jede regulare Grammatik gibt es einen aquivalenten DFA“

Problem:

Produktionen: A→ aA1 und A→ aA2 konnen inGrammatiken vorkommen

Konstruktion des determinstischen Automaten unklar.

Daher: Beweis, dass DFAs alle regularen Sprachen akzeptieren,erfolgt auf Umwegen

Nichtdeterministische Endliche Automaten

Zustandswechsel nicht eindeutig, sondern nichtdeterministischin einen von mehreren moglichen

D.h. der Automat darf sozusagen”raten“ welchen

Nachfolgezustand er wahlt

Im Zustandsgraph erlaubt:

Technisch:

DFA δ : Z × Σ→ Z und ein StartzustandNFA δ : Z × Σ→ P(Z) und Menge von Startzustanden

Definition NFA

Definition

Ein nichtdeterministischer endlicher Automat (nondeterministicfinite automaton, NFA) ist ein 5-Tupel (Z,Σ, δ, S,E) wobei

Σ ist das (endliche) Eingabealphabet mit (Z ∩ Σ) = ∅,S ⊆ Z ist die Menge der Startzustande,

E ⊆ Z ist die Menge der Endzustande und

δ : Z × Σ→ P(Z) ist die Zustandsuberfuhrungsfunktion

Akzeptanz beim NFA

”Ein Wort w wird vom NFA akzeptiert, wenn es einen Pfad von

einem Startzustand zum Endzustand entlang w gibt“

Definition (Akzeptierte Sprache eines NFA)

Sei M = (Z,Σ, δ, S,E) ein NFA.Wir definieren δ : (P(Z)× Σ∗)→ P(Z) induktiv durch:

δ(X, ε) := X fur alle X ⊆ Zδ(X, aw) :=

⋃z∈X

δ(δ(z, a), w) fur alle X ⊆ Z

L(M) = {w ∈ Σ∗ | δ(S,w) ∩ E 6= ∅}

Beispiel: Leere Menge von Startzustanden

Sei M = (Z,Σ, δ, ∅, E) ein NFA.Dann ist L(M) = ∅.

Lauf beim NFA

Definition

Sei M = (Z,Σ, δ, S,E) ein NFA und w ∈ Σ∗ mit |w| = n.Eine Folge von Zustanden q0, . . . , qn mit q0 ∈ S undqi ∈ δ(qi−1, w[i]) bezeichnet man als Lauf von M fur Wort w.

Beachte: Wahrend es bei DFAs genau einen Lauf pro Wort gibt,kann es bei NFAs mehrere geben.

Beispiel

Sei M = ({z0, z1, z2, z3}, {a, b, c}, δ, {z0, z3}, {z3}) ein NFA mit

δ(z0, a) = {z0, z1}δ(z0, b) = {z0}δ(z0, c) = {z0}

δ(z1, a) = {z2}δ(z1, b) = {z2}δ(z1, c) = {z2}

δ(z2, a) = {z3}δ(z2, b) = {z3}δ(z2, c) = {z3}

δ(z3, a) = ∅δ(z3, b) = ∅δ(z3, c) = ∅

Der Zustandsgraph zuM ist z0 z1 z2 z3a a, b, c a, b, c

a, b, c

L(M) = {ε} ∪ {uaw | u ∈ {a, b, c}∗, w ∈ {a, b, c}2}

Jede regulare Sprache wird durch NFA erkannt

Theorem 4.4.1

Fur jede regulare Sprache L gibt es einen NFA M mit L(M) = L.

Beweis:

Sei G = (V,Σ, P, S) eine regulare Grammatik mit L(G) = L.

Sei M = (Z,Σ, δ, S′, E) ein NFA mit Z = V ·∪{zE} (zE neu), S′ = {S}und E = {zE , S} falls S → ε ∈ P , sonst E = {zE}, und

δ(A, a) := {B | A→ aB ∈ P} ∪ {zE | falls A→ a ∈ P}δ(zE , a) := ∅ fur alle a ∈ Σ.

Es gilt: ε ∈ L(M) ⇐⇒ ε ∈ L(G).

Fur w = a1 · · · an gilt:

w ∈ L(G) g.d.w. S ⇒G a1A1 ⇒G . . .⇒G a1 · · · an−1An−1 ⇒G a1 · · · ang.d.w. Es gibt Zustande A1, . . . , An−1 mit

A1 ∈ δ(S, a1), Ai+1 ∈ δ(Ai, ai+1) fur 1 ≤ i ≤ n− 2und zE ∈ δ(An−1, an)

g.d.w. w ∈ L(M)

Beispiel: Konstruktion NFA aus Typ 3-Grammatik

Betrachte die regulare Grammatik G = (V,Σ, P,A)mit V = {A,B,C,D}, Σ = {a, b, c} und

P = { A→ ε | aB | bB | cB | aC,B → aB | bB | cB | aC,C → aD | bD | cD,D → a | b | c}

Konstruktion des dazu passenden NFA: M = (Z,Σ, δ, S,E) mit

Z = V ∪ {zE} = {A,B,C,D, zE},E = {A, zE}, S = {A} und

δ(A, a)={B,C}δ(A, b)={B}δ(A, c)={B}

δ(B, a)={B,C}δ(B, b)={B}δ(B, c)={B}

δ(C, a)={D}δ(C, b)={D}δ(C, c)={D}

δ(D, a)={zE}δ(D, b)={zE}δ(D, c)={zE}

δ(zE , a)=∅δ(zE , b)=∅δ(zE , c)=∅

Beispiel: Konstruktion NFA aus Typ 3-Grammatik (2)

Der Zustandsgraph zu M ist

B C D zEa a, b, c a, b, c

a, b, c

a, b, ca

NFAs in DFAs transformieren

Theorem 4.5.1 (Rabin & Scott 1959)

Jede von einem NFA akzeptierte Sprache ist auch durch einen DFAakzeptierbar.

Beweisidee:

Konstruiere fur einen gegebenen NFA einen DFA, sodass sich

”der DFA alle Zustande merkt, in denen der NFA sein konnte“

Z.B. babbabb z0

z0z0z0z0z0z0z0z0

z3z3z3

a a, b, c a, b, c

a, b, c

Konstruktion: Jede Teilmenge von Zustanden des NFA wird zueinem Zustand des DFA (daher: Potenzmengenkonstruktion)

Potenzmengenkonstruktion

Fur NFA M = (Z,Σ, δ, S,E) konstruieren wir den DFAM ′ = (Z ′,Σ, δ′, S′, E′) mit

Z ′ = P(Z)

”Zustandsmenge ist Potenzmenge von Z“

S′ = S

”Startzustand ist Menge S aller Startzustande von M“

E′ = {X ∈ Z ′ | (E ∩X) 6= ∅}

”Jede Menge, die mind. einen Endzustand von E enthalt, ist

Endzustand in M ′“

δ′(X, a) =⋃z∈X

δ(z, a) = δ(X, a)

”δ′(X, a) berechnet alle von einem Zustand in X aus uber a

erreichbaren Zustande.“

Korrektheit der Potenzmengenkonstruktion

Wir beweisen, dass L(M) = L(M ′) gilt, indem wir zeigen:

w ∈ L(M) g.d.w. w ∈ L(M ′)

Fall w = ε:

ε ∈ L(M) g.d.w. S ∩ E 6= ∅ g.d.w S ∈ E′ g.d.w. ε ∈ L(M ′)

Fall w = a1 · · · an ∈ Σ∗:

w ∈ L(M)

g.d.w. δ(S,w) ∩ E 6= ∅g.d.w. Es gibt Teilmengen Z1, . . . , Zn von Z mit

δ(S, a1) = Z1, δ(Zi, ai+1) = Zi+1 fur i = 1, . . . , n− 1und Zn ∩ E 6= ∅

g.d.w. δ′(S′, w) ∈ E′g.d.w w ∈ L(M ′)

Beispiel: Potenzmengenkonstruktion

Fur NFA z0 z1 z2 z3a a, b, c a, b, c

a, b, c

wird der DFA konstruiert:

M ′ = (P({z0, z1, z2, z3}), {a, b, c}, δ′, S′, E′) mitS′ = {z0, z3}E′ = {{z3}, {z0, z3}, {z1, z3}, {z2, z3}, {z0, z1, z3}, {z0, z2, z3}, {z1, z2, z3}, {z0, z1, z2, z3}}δ′(∅, d) = ∅ fur d ∈ {a, b, c}δ′({z0}, a) = {z0, z1}δ′({z0}, d) = {z0} fur d ∈ {b, c}δ′({z1}, d) = {z2} fur d ∈ {a, b, c}δ′({z2}, d) = {z3} fur d ∈ {a, b, c}δ′({z3}, d) = ∅ fur d ∈ {a, b, c}δ′({z0, z1}, a) = {z0, z1, z2}δ′({z0, z1}, d) = {z0, z2} fur d ∈ {b, c}δ′({z0, z2}, a) = {z0, z1, z3}δ′({z0, z2}, d) = {z0, z3} fur d ∈ {b, c}δ′({z0, z3}, a) = {z0, z1}δ′({z0, z3}, d) = {z0} fur d ∈ {b, c}δ′({z1, z2}, d) = {z2, z3} fur d ∈ {a, b, c}

δ′({z1, z3}, d) = {z2} fur d ∈ {a, b, c}δ′({z2, z3}, d) = {z3} fur d ∈ {a, b, c}δ′({z0, z1, z2}, a) = {z0, z1, z2, z3}δ′({z0, z1, z2}, d) = {z0, z2, z3} fur d ∈ {b, c}δ′({z0, z1, z3}, a) = {z0, z1, z2}δ′({z0, z1, z3}, d) = {z0, z2} fur d ∈ {b, c}δ′({z0, z2, z3}, a) = {z0, z1, z3}δ′({z0, z2, z3}, d) = {z0, z3} fur d ∈ {b, c}δ′({z1, z2, z3}, d) = {z2, z3} fur d ∈ {a, b, c}δ′({z0, z1, z2, z3}, a) = {z0, z1, z2, z3}δ′({z0, z1, z2, z3}, b) = {z0, z2, z3}δ′({z0, z1, z2, z3}, c) = {z0, z2, z3}

Beispiel: Potenzmengenkonstruktion (2)

z0z0z0z0z0z0z0z0

z3z3z3

a a, b, c a, b, c

a, b, c

Ablauf bei Eingabe babbabb

DFA als Zustandsgraph (nur erreichbare Zustande):

{z0,z3}

{z0,z3}{z0,z3}{z0,z3}

{z0,z1}

{z0,z1}{z0,z1}

{z0,z1,z2} {z0,z1,z2,z3}

{z0,z2,z3}{z0,z2}

{z0,z2}{z0,z2}

{z0,z1,z3}

DFAs & NFAs sind Formalismen fur Typ 3-Sprachen

Theorem 4.5.4

DFAs und NFAs erkennen genau die regularen Sprachen.

Das folgt aus:

Theorem 4.2.1: Sei M ein DFA. Dann ist L(M) regular.

Theorem 4.4.1: Fur jede regulare Sprache L gibt es einen NFAM mit L(M) = L.

Theorem 4.5.1: Jede von einem NFA akzeptierte Sprache istauch durch einen DFA akzeptierbar.

Jeder DFA kann leicht auch als NFA interpretiert werden

Große des DFAs vs NFAs (1)

Sei M ein NFA mit n Zustanden.

Der durch die Potenzmengenkonstruktion erstellte DFA hat 2n

Zustande!

D.h. der Platz explodiert uns!

Frage: Geht es besser (unsere Kodierung ist zu einfach) odernicht?

Das folgende Lemma zeigt, dass es nicht wirklich besser geht

Sei Ln = {uav | u ∈ {a, b}∗, v ∈ {a, b}n−1} fur n ∈ N>0.(Sprache aller Worter aus {a, b}∗, die an n-letzter Stelle ein a haben).

Es gibt NFA Mn mit L(Mn) = Ln und Mn hat n+ 1 Zustande.

Jeder DFA M ′n mit L(M ′n) = Ln, hat mindestens 2n Zustande.

Beweis (Teil 1): Sei Mn der folgende NFA:

z0 z1 z2 zn−1 zna a, b a, b a, b a, b

L(Mn) = Ln, denn:

zum Akzeptieren mussen z0, z1, . . . zn nacheinander durchlaufenwerden, was genau mit Wortern av mit v ∈ {a, b}n−1 moglich ist

In z0 kann zuvor jedes u ∈ {a, b}∗ gelesen werden (Verbleib in z0).

Beweis (Teil 2): Beweis durch Widerspruch.

Annahme: Es gibt n ∈ N>0 und DFA M ′ = (Z, {a, b}, δ, z0, E) mitL(M ′) = Ln = {uav | u ∈ {a, b}∗, v ∈ {a, b}n−1} und |Z| < 2n

Menge W = {a, b}n enthalt 2n Worte der Lange n und da |Z| < 2n,muss es w 6= w′ ∈W geben mit δ(z0, w) = δ(z0, w

′) = zi

Sei j die erste Position, an der sich w und w′ unterscheiden.

Falls j = 1, dann ist o.B.d.A. w = au ∈ Ln aber w′ = bu′ 6∈ Ln undzi ∈ E und zi 6∈ E musste gleichzeitig gelten. Widerspruch!

Falls j > 1: O.B.d.A. w = uav und w′ = ubv′ mit |v| = |v′| = n− j

Sei w0 = wbj−1 = uavbj−1

w′0 = w′bj−1= ubv′bj−1

Dann muss gelten δ(w0) = δ(w′0), da δ(uav) = zi = δ(ubv′).

Aber w0 ∈ Ln und w′0 6∈ Ln, Widerspruch!

NFAs mit ε-Ubergangen

ε-Ubergange erlauben Zustandswechsel ohne Lesen eines Zeichens(es wird sozusagen das leere Wort ε gelesen)

Ausdruckskraft andert sich mit ε-Ubergangen nicht

ε-Ubergange machen manche Konstruktionen einfacher.

Definition (NFA mit ε-Ubergangen)

Ein nichtdeterministischer endlicher Automat mit ε-Ubergangen (NFA mitε-Ubergangen) ist ein Tupel M = (Z,Σ, δ, S,E) wobei

Σ ist das (endliche) Eingabealphabet mit (Z ∩ Σ) = ∅,S ⊆ Z ist die Menge der Startzustande,

E ⊆ Z ist die Menge der Endzustande und

δ : Z × (Σ∪{ε})→ P(Z) ist die Zustandsuberfuhrungsfunktion

Beispiel: NFA mit ε-Ubergangen

z0 z2 z3 z4a a, b, c a, b, c

a, b, c

Akzeptierte Sprache:

alle Worte aus {a, b, c}∗, die an letzter, vorletzter, oderdrittletzter Postion ein a haben, und das leere Wort

ε-Hulle

Definition (ε-Hulle)

Sei M = (Z,Σ, δ, S,E) ein NFA mit ε-Ubergangen. Die ε-Hulleclosε(z) eines Zustands z ∈ Z ist induktiv definiert als die kleinsteMenge von Zustanden, welche die folgenden Eigenschaften erfullt:

1 z ∈ closε(z).

2 Wenn z′ ∈ closε(z) und z′′ ∈ δ(z′, ε), dann ist auchz′′ ∈ closε(z).

Fur eine Zustandsmenge X ⊆ Z definieren wirclosε(X) :=

⋃z∈X closε(z).

Die ε-Hulle fugt fur eine Zustandsmenge alle durch ε-Ubergangeerreichbaren Zustande hinzu.

ε-Hulle (2)

Die ε-Hulle fur eine Zustandsmenge X ⊆ Z kann auch berechnetwerden durch:

closε(X) :=

{X, wenn

⋃z∈X δ(z, ε) ⊆ X

closε(X ∪⋃z∈X δ(z, ε)), sonst

Beispiel

z0 z2 z3 z4a a, b, c a, b, c

a, b, c

closε(z0) = {z0}closε(z1) = {z1}closε(z4) = {z4}closε(z3) = {z1, z3, z4}closε(z2) = {z1, z2, z3, z4}

NFA mit ε-Ubergangen: Akzeptierte Sprache

Akzeptierte Sprache eines NFA mit ε-Ubergangen

Sei M = (Z,Σ, δ, S,E) ein NFA mit ε-Ubergangen.Wir definieren δ : (P(Z)× Σ∗)→ P(Z) induktiv durch:

δ(X, ε) := X

δ(X, aw) :=⋃z∈X

δ(closε(δ(z, a)), w) fur alle X ⊆ Z

L(M) := {w ∈ Σ∗ | δ(closε(S), w) ∩ E 6= ∅}

ε-Ubergange andern die Ausdruckskraft nicht (1)

Satz 4.6.7

NFAs mit ε-Ubergangen akzeptieren genau die regularen Sprachen.

Beweis”⇐“:

Jede regulare Sprache wird von einem”normalen“ NFA

akzeptiert.

Transformiere diesen NFA in einen NFA mit ε-Ubergangen:

Setze δ(z, ε) = ∅ fur alle Zustande z

Offensichtlich ist die akzeptierte Sprache diesselbe.

Daher wird jede regulare Sprache von einem NFA mitε-Ubergangen akzeptiert.

ε-Ubergange andern die Ausdruckskraft nicht (2)

Beweis”⇒“: Sei M = (Z,Σ, δ, S,E) ein NFA mit ε-Ubergangen.

Konstruiere NFA M ′ mit L(M) = L(M ′). Dann ist L(M) regular.

M ′ = (Z,Σ, δ′, S′, E) mit S′ = closε(S), δ′(z, a) = closε(δ(z, a)).

L(M) = L(M ′):

Wir zeigen δ(closε(X), w) = δ′(closε(X), w) fur alle X ⊆ Z undw ∈ Σ∗. Wir verwenden Induktion uber die Wortlange |w|.Basis: w = ε. Dann gilt δ(closε(X), ε) = closε(X) = δ′(closε(X), ε)

Schritt: Sei w = au mit a ∈ Σ. Wir formen um:

δ(closε(X), au)Def. δ

z∈closε(X)

δ(closε(δ(z, a)), u)I.H.=

⋃z∈closε(X)

δ′(closε(δ(z, a)), u)

Def. δ′=

⋃z∈closε(X)

δ′(δ′(z, a), u)Def. δ

= δ′(closε(X), au)

Eindeutige Start- und Endzustande

Satz 4.6.8

Fur jeden NFA M mit ε-Ubergangen gibt es einen NFA M ′ mitε-Ubergangen, sodass L(M) = L(M ′) und M ′ genau einenStartzustand und genau einen Endzustand hat, wobei diese beidenZustande verschieden sind.

Beweis: Konstruiere M ′ aus M , durch Hinzufugen eines neuenStart- und eines neuen Endzustand mit ε-Ubergangen:

M wird zu

Beispiel

z0 z2 z3 z4a a, b, c a, b, c

a, b, c

wird zu

zS zEz1

ε z2 z3 z4a a, b, c a, b, c

a, b, c

Regulare Ausdrucke

Regulare Ausdrucke sind (wie Automaten und Grammatiken)ein Formalismus zur Reprasentation von Sprachen.

Praktische Verwendung: Regex-Bibliotheken inProgrammiersprachen zum Suchen und Ersetzen vonZeichenketten(verwenden meist erweiterte regulare Ausdrucke)

Aufbau regularer Ausdrucke:Basisausdrucke und Operatoren zum Zusammensetzen.

Regulare Ausdrucke (2)

Definition (Regularer Ausdruck)

Sei Σ ein Alphabet. Ein regularer Ausdruck uber Σ ist induktiv definiert:

∅ ist ein regularer Ausdruck

ε ist ein regularer Ausdruck

a mit a ∈ Σ ist ein regularer Ausdruck

Wenn α1 und α2 regulare Ausdrucke sind, dann auch α1α2

Wenn α1 und α2 regulare Ausdrucke sind, dann auch (α1|α2)

Wenn α regularer Ausdruck ist, dann auch (α)∗

Regulare Ausdrucke (3)

Erzeugte Sprache

Die von einem regularen Ausdruck α erzeugte Sprache L(α) istinduktiv uber dessen Struktur definiert:

L(∅) := ∅L(ε) := {ε}L(a) := {a} fur a ∈ Σ

L(α1α2) := L(α1)L(α2) = {uv | u ∈ L(α1), v ∈ L(α2)}L(α1|α2) := L(α1) ∪ L(α2)L((α)∗) := L(α)∗

Fur alle regularen Ausdrucke α1, α2, α3 gilt:

L((α1|α2)|α3) = L(α1|(α2|α3))

Daher lassen wir Klammern weg und schreiben (α1|α2| . . . |αn).

Beispiele

(a|b)∗aa(a|b)∗ erzeugt alle Worte uber {a, b} die zweiaufeinanderfolgende a’s enthalten

(ε|((a|b|c)∗a(a|b|c)(a|b|c)(a|b|c))) erzeugt alle Worte uber{a, b, c}, die an viertletzter Stelle ein a haben und das leereWort

((0|1|2|3|4|5|6|7|8|9)|1(0|1|2|3|4|5|6|7|8|9)|(2(0|1|2|3))) :((0|1|2|3|4|5)(0|1|2|3|4|5|6|7|8|9)) erzeugt alle Uhrzeiten im24-Stunden-Format

Eine endliche Sprache S = {w1, . . . , wn} wird durch(w1| . . . |wn) erzeugt.

Satz von Kleene

Theorem 4.7.4 (Satz von Kleene)

Regulare Ausdrucke erzeugen genau die regularen Sprachen.

Beweis in zwei Teilen:

1 Jede von einem regularen Ausdruck erzeugte Sprache istregular.

2 Fur jede regulare Sprache gibt es einen regularen Ausdruck,der sie erzeugt.

Beweis: Satz von Kleene (1)

1. Jede von einem regularen Ausdruck erzeugte Sprache ist regular.Beweis:

Wir konstruieren fur regularen Ausdruck α einen NFA Mα mitε-Ubergangen und eindeutigen Start- und Endzustanden,sodass L(Mα) = L(α).

Induktion uber die Struktur von α

Basisfalle:

Fur α = a ∈ Σ konstruierea

Fur α = ε konstruiereε

Fur α = ∅ konstruiere

In allen Fallen ist L(α) = L(Mα) offensichtlich

Induktionsschritt: Betrachte den Aufbau von α (3 Falle)

Fur α = α1α2, liefert die I.H. Mα1,Mα2

Mα1Mα2

Konstruiere daraus Mα:

Fur α = (α1|α2) liefert die I.H. Mα1,Mα2

Fur α = (α1)∗ liefert die I.H. Mα1

2. Fur jede reg. Sprache L gibt es einen regularen Ausdruck α mit L(α) = LBeweis:

Sei DFA M = ({z1, . . . , zn},Σ, δ, z1, E) mit L(M) = L gegeben.

Fur w ∈ Σ∗ und zi ∈ z mit δ(zi, w) = zj sei visit i(w) = q1, . . . , qmdie Folge der besuchten Zustande (wobei q1 = zi und qm = zj).

Wir definieren:

Lki,j =

{w ∈ Σ∗

δ(zi, w) = zj und visit i(w) = q1, . . . , qm,sodass fur 1 < l < m: wenn ql = zp dann p ≤ k

}Lki,j enthalt die Worte, die M von Zustand zi zu Zustand zj fuhrenohne dabei Zwischenzustande mit Index großer als k zu benutzen.

Mit Induktion uber k zeigen wir, dass es regulare Ausdrucke αki,j mit

L(αki,j) = Lki,j gibt.

Zur Erinnerung: Lki,j enthalt die Worte, die M von Zustand zi zu Zustand zj fuhren ohne

dabei Zwischenzustande mit Index großer als k zu benutzen.

Basis: k = 0

Wenn i 6= j, dann ist L0i,j = {a ∈ Σ | δ(zi, a) = zj}.

Falls L0i,j = {a1, . . . , aq}, dann gilt L(α0

i,j) = L0i,j fur α0

i,j = (a1| . . . |aq).

Falls L0i,j = ∅, dann gilt L(α0

i,j) = L0i,j mit α0

i,j = ∅.Wenn i = j, dann ist L0

i,i = {ε} ∪ {a ∈ Σ | δ(zi, a) = zi}.

Sei L0i,i = {ε, a1, . . . , aq}.

Dann gilt L(α0i,i) = L0

i,i fur α0i,i = (ε|a1| . . . |aq).

Beweis: Satz von Kleene (7)Zur Erinnerung: Lk

i,j enthalt die Worte, die M von Zustand zi zu Zustand zj fuhrenohne dabei Zwischenzustande mit Index großer als k zu benutzen.

Induktionsschritt: k → k + 1

Lk+1i,j = Lki,j ∪ Lki,k+1(L

kk+1,k+1)

∗Lkk+1,j ,

denn entweder lauft M ohne Zustand zk+1 zu besuchen, oder der Laufkann in 3 Teile gespalten werden:

1 Lauf von zi bis zum ersten Besuch des Zustands zk+1

(abgedeckt durch Lki,k+1)

2 Mehrmaliges, zyklisches Besuchen von k + 1 (beliebig oft)(abgedeckt durch Lkk+1,k+1)

3 Letztmaliges Verlassen von zk+1 und Lauf bis zu zj(abgedeckt durch Lkk+1,j)

Daher gilt αk+1i,j = (αki,j |αki,k+1(α

kk+1,k+1)

∗αkk+1,j) und L(αk+1i,j ) = Lk+1

Fur E = {zi1 , . . . , zir} gilt L(αn1,i1 |αn1,i2| . . . |αn1,ir) =

⋃zi∈E

Ln1,i = L(M)TCS | 02 Regulare Sprachen (I) | SoSe 2019 55/58 DFAs NFAs NFAs+ε Regulare Ausdrucke Zusammenf.

Beispiel: Regularer Ausdruck → NFA mit ε-Ubergangen

NFA zum regularen Ausdruck

(ε|(a|b)∗b(a|b))

konstruieren:

ε bε

Beispiel: DFA → regularer Ausdruck

Regularer Ausdruck dazu:

α21,2 = (α1

1,2|α11,2(α

12,2)∗α1

= ((a|ε(ε)∗a) | (a|ε(ε)∗a) (ε|a(ε)∗a)∗ (ε|a(ε)∗a))

= (a|a(aa)∗) (durch Vereinfachung)

α01,1 = ε α0

2,2 = ε α01,2 = a α0

2,1 = a

α11,2 = (α0

1,2|α01,1(α

01,1)∗α0

1,2) = (a|ε(ε)∗a)

α12,2 = (α0

2,2|α02,1(α

01,1)∗α0

1,2) = (ε|a(ε)∗a)

Zusammenfassung: Formalismen fur regulare Sprachen

Regulare Grammatiken(=Regulare Sprachen)

NFAs mit ε-Ubergangen

NFAs mit ε-Ubergangen undeindeutigem Start- und

Endzustand

Regulare Ausdrucke

Theorem 4.2.1

offensichtlich

Theorem 4.5.1Theorem 4.4.1

Satz 4.6.7

Satz 4.6.8

Theorem 4.7.4

Kanten → zeigen Kodierungen

Regul are Sprachen - LMU

Documents

Syntax natürlicher Sprachen - LMU Munichleiss/syntax-10-11/folien-syntax-10-11.pdf · 1.Gerhard Helbig, Joachim Buscha: Deutsche Grammatik. Ein ... Langenscheidt, 1996 2.Peter Eisenberg:

Bethune Regul

LMU München - Kontextsensitive Inhaltebereitstellung: … · 2012. 8. 19. · Ludwig Maximilians Universität München LMU Interdisziplinäres Forschungsprojekt der LMU München

Sprachen Sprachen - berlin.de · Sprachen Sprachen Europäische Kompetenzstufen • Selbsteinstufung 108 Deutsch Beratung 112 Fremdsprachenberatung 137 Deutsch 120 Englisch 138

Tariff & Regul Principles

Formale Sprachen, regul¨are und kontextfreie Grammatiken · 2020. 12. 15. · Deﬁnition kontextfreie Grammatik (context free grammar, CFG) G = (N,T,P,σ) mit den Komponenten: N

REGUL AMENTE - EUR-Lex

SPRACHEN Sprachen

Regul Adoresf

Einheit 2.5 Eigenschaften regulärer Sprachen€¦ · Theoretische Informatik I §2: 3 Eigenschaften regularer Sprachen¨ Abschlusseigenschaften, präzisiert Zeige: L1,L2 regulär

Regul. Humcar

Regul Temp Peltier

Regul Cdep

Reguläre Ausdr ücke - Theoretical Computer Sciencetheo.cs.ovgu.de/lehre05s/ti_iif/folien/folien06b.pdf · Reguläre Ausdr ücke Definition (Reguläre Ausdr ücke) Sei Σ

Die Symmetrien der regul aren Polyeder...Die Symmetrien der regul aren Polyeder Margit R osler Lehrerfortbildung am Math. Institut der TU Clausthal, April 2008 1. Regul are Polyeder

Sumarinis Procesas_palyginimas Su Ankstesniu Regul

1. Formale Sprachen 1.2 Grammatiken formaler Sprachen · Informatik 12 1. Formale Sprachen 1.2 Grammatiken formaler Sprachen 1. Formale Sprachen 1.2 Grammatiken formaler Sprachen

Buen día, AGPS AMWELL APK-COMcalamp 40. lmu-1100 41. lmu-1200 42. lmu-2000 43. lmu-2100 44. lmu-2600 45. lmu-2700 46. lmu-300 47. lmu-3030 48. lmu-400 49. lmu-4200 50. lmu-4520 51

Wort- und Satzbetonung - LMU Münchenjmh/lehre/sem/ws0607/prosody/... · Wortbetonung – allgemeine Prinzipien In fast allen Sprachen werden die Silben in mehrsilbigen Wörtern mit

E-COMMERCE: Regul@r o no Regul@r, ¿esa es la cuestión?