25
Składnia Składnia to nauka o związkach wyrazów w zdaniu, szyku wyrazów i roli pełnionej przez wyrazy. Zapis składni powinien w łatwy sposób umożliwiać jej opis i wykorzystanie w automatycznej analizie zdania. Analiza składniowa dostarcza informacji o związkach wyrazów w zdaniu, najczęściej w postaci drzewa. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272)

Składnia - eti.pg.edu.pl · Literatura dotycząca składni AndrewRadford,Transformational Grammar. A First Course, CambridgeTextbooksinLinguistics,CambridgeUniversityPress,

Embed Size (px)

Citation preview

Składnia

Składnia to nauka o związkach wyrazów w zdaniu, szyku wyrazów iroli pełnionej przez wyrazy.Zapis składni powinien w łatwy sposób umożliwiać jej opis iwykorzystanie w automatycznej analizie zdania.Analiza składniowa dostarcza informacji o związkach wyrazów wzdaniu, najczęściej w postaci drzewa.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272)

Klasyfikacja opisów składni

Ze względu na zakres:z szerokim pokryciemspecjalizowane

Ze względu na rodzaj opisywanych zależności:wyodrębniające części zdaniazależnościowe

Ze względu na sposób przechowywania reguł składniowych:zleksykalizowanebez leksykalizacji

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (249 / 272)

Gramatyki transformacyjne

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (250 / 272)

Gramatyki transformacyjne

..XP.

spec.

.

X’

.

X

.

dopełnienia

X (także X0) – element główny (ang. head), XP (także X′′, X, X2) – frazaX („P” w angielskim pochodzi od phrase, po angielsku XP jest nazywanemaximal projection (of X), X′ (także X – intermediate projection) –kategoria pośrednia.Reguły:

XP→ Spec. X′

X′ → X dopełnieniaJan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (251 / 272)

Gramatyki transformacyjne

..CP[+q].

C′

.

C[+q]

.

IP

.

NP∆

John

.

I′

.

I[+fin]

.

VP

.

V′

.

V[+aux]|

has

.

VP[+en]

.

V′

.

V[+en]|

read

.

NP∆

the book

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (252 / 272)

Gramatyki transformacyjne

..CP[+q].

C′

.

V[+aux]|

hasi

.

IP

.

NP∆

John

.

I′

.

I[+fin]|ti

.

VP

.

V′

.

V[+aux]|ti

.

VP[+en]

.

V′

.

V[+en]|

read

.

NP∆

the book

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (253 / 272)

Gramatyki transformacyjne

..CP[+q]..

C′

.

C[+q]

.

IP

.

NP∆

John

.

I′

.

I[+fin]

.

VP

.

V′

.

V[+aux]|

has

.

VP[+en]

.

V′

.

V[+en]|

read

.

NP[+wh]

.

D[+wh]|

which

.

N′

.

N

.

book

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (254 / 272)

Gramatyki transformacyjne

..CP[+q].NP[+wh]

∆which booki

.

C′

.

C[+q]|

hasj

.

IP

.

NP∆

John

.

I′

.

I[+fin]|tj

.

VP

.

V′

.

V[+aux]|tj

.

VP[+en]

.

V′

.

V[+en]|

read

.

NP[+wh]

.

ti

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (255 / 272)

Lexical-Functional Grammar

Analiza zdania w tej gramatyce opiera się na dwóch strukturach:c-structure (z ang. constituent structure) if-structure (z ang. functional structure).

C-structure ma postać drzew uzyskanych z użyciem gramatykibezkontekstowej. Może mieć różną postać w różnych językach. F-structurema postać par (cecha, wartość) i reprezentuje powiązania często odległychod siebie fragmentów zdania.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (256 / 272)

Lexical-Functional Grammar

..S1.

S(↑=↓)

.

NP(↑ subj =↓)

.

NNP(↑=↓)

.

..John( ..↑ pred =′ john′

.. ..↑ num = sg

.. ..↑ pers = 3)

.

VP(↑=↓)

.

VBZ(↑=↓)

.

..has( ..↑ pred =′ have′)

.

..VP ..↑ xcomp =↓

.. ..↑ obj =↓ obj

.

VBN(↑=↓)

.

..read( ..↑ pred =′ read′

.. ..↑ tense = past)

.

NP(↑ obj =↓)

.

DT(↑ spec:det =↓)

.

the(↑ pred =′ the′)

.

NN(↑=↓)

.

..book( ..↑ pred =′ book′

.. ..↑ num = sg

.. ..↑ pers = 3)

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (257 / 272)

Lexical-Functional Grammar

..S1.

S(↑=↓)

.

NP(↑ subj =↓)

.

NNP(↑=↓)

.

..John( ..↑ pred =′ john′

.. ..↑ num = sg

.. ..↑ pers = 3)

.

VP(↑=↓)

.

VBZ(↑=↓)

.

..has( ..↑ pred =′ have′)

.

..VP ..↑ xcomp =↓

.. ..↑ obj =↓ obj

.

VBN(↑=↓)

.

..read( ..↑ pred =′ read′

.. ..↑ tense = past)

.

NP(↑ obj =↓)

.

DT(↑ spec:det =↓)

.

the(↑ pred =′ the′)

.

NN(↑=↓)

.

..book( ..↑ pred =′ book′

.. ..↑ num = sg

.. ..↑ pers = 3)

. wszystkie cechy dzielone z wyższym węzłem.

cecha pred dzielona z wyższym węzłem

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (258 / 272)

Lexical-Functional Grammar

..S1.

S(↑=↓)

.

AUX(↑=↓)

.

Has(↑ pred =′ has′)

.

NP(↑ subj =↓)

.

NNP(↑=↓)

.

..John( ..↑ pred = John′

.. ..↑ num = sg

.. ..↑ pers = 3)

.

VP(↑ xcomp =↓, ↑ obj =↓ obj)

.

VB(↑=↓)

.

read(↑ pred =′ read′)

.

NP(↑ obj =↓)

.

DT(↑ spec:det =↓)

.

the(↑ pred =′ the′)

.

NN(↑=↓)

.

..book( ..↑ pred =′ book′

.. ..↑ num = sg

.. ..↑ pers = 3)

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (259 / 272)

Head-Driven Phrase Structure Grammar

HPSG wywodzi się z GPSG (ang. Generalized Phrase StructureGrammar).Gramatyka zleksykalizowana – informacje o łączliwości słów wsłowniku.Gramatyka unifikacyjna – poszczególne obiekty posiadają cechy, naktóre można nakładać ograniczenia odwzorowujące zjawiskazachodzące w języku.Część ograniczeń jest zapisywana bezpośrednio za pomocąwspółdzielenia cech.Część ograniczeń wynika z ogólnych zasad, takich jak zasada elementugłównego, zasada struktury argumentów, czy zasada walencji.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (260 / 272)

Head-Driven Phrase Structure Grammar

wordphon

⟨dał

ss | lc

local

cat

category

head 1

verbgender mascperson 3rdnumber sg

val

valencesubj

⟨1

⟩comps

⟨2 , 3

arg-st⟨

1NP[nom] 4 , 2NP[dat] 5 , 3NP[acc] 6⟩

cont

givegiver 4

given 6

recipient 5

Zarówno słowa,jak i zdania sąopisywane przezstruktury cech.

Współdzieleniewartości cechzapisywane jest zapomocą liczb wkwadratach, np.1 : wartość cechySS|LC|CAT|HEADjest tożsamawartością cechySS|LC|CAT|VAL|SUBJ.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (261 / 272)

Tree Adjoining Grammar

Gramatyka istnieje w wielu wersjach (XTAG, LTAG, …), dla których istniejąróżne analizatory składniowe. Podstawowe cechy:

Z każdym słowem w słowniku związane jest drzewo określającemiejsce słowa w zdaniu – rolę, jaką pełni w składni.Każde podstawowa struktura (w TAG – drzewo) posiada co najmniejjeden symbol końcowy (słowo). Innymi słowy: TAG jest gramatykązleksykalizowaną.Przy dokonywaniu analizy składniowej zdania wykonuje się dwieoperacje na drzewach:

zastępowanie (ang. substitution)dołączanie (ang. adjunction)

Na każdą z operacji można nałożyć dodatkowe warunki za pomocąunifikacji.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (262 / 272)

Tree Adjoining Grammar – Zastępowanie

Jeden z liści drzewa jest zastępowany poddrzewem o tej samej etykiecie.

..DP.John

..DP.a book

..IP.DP

.I′

.

I

.

VP

.

V

.

reads

.

DP

W wyniku zastępowania dokonanego na liściach trzeciego drzewaotrzymamy:

..IP.DP

.

John

.I′

.

I

.

VP

.

V

.

reads

.

DP

.

a book

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (263 / 272)

Tree Adjoining Grammar – dołączanie

Podstawowe drzewa dzielimy na dwie kategorie:...1 pomocnicze: korzeń drzewa ma tę samą etykietę (kategorię) cowyznaczony liść drzewa

...2 początkowe: wszystkie inneDołączanie polega na wstawieniu drzewa pomocniczego o korzeniu A zetykietą X i wyznaczonym liściem B o tej samej etykiecie do innego drzewaw miejsce węzła C o etykiecie X w taki sposób, że rodzic węzła C staje sięrodzicem węzła A, a dzieci węzła C stają się dziećmi węzła B.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (264 / 272)

Tree Adjoining Grammar – dołączanie..IP.

DP.

John

.I′

.

I

.

VP

.

V

.

reads

.

DP

.

a book

..VP.

patiently

.

VPPo operacji dołączenia otrzymamy:

..IP.

DP

.

John

.

I′

.

I

.

VP

.

patiently

.

VP

.

V

.

reads

.

DP

.

a bookJan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (265 / 272)

Link Grammar

W tej gramatyce słowa w słowniku wyposażone są w zestawyuporządkowanych, nazwanych wiązań. Wiązania dzielą się na lewostronne(łączą się z wiązaniami innych słów leżących w tekście na lewo od danegosłowa) i prawostronne (analogicznie). Lewo- i prawostronne wiązaniauporządkowane są pod względem odległości słów, z których wiązaniami sięłączą. Słowo może mieć kilka alternatywnych zestawów wiązań.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (266 / 272)

Link Grammar

Ciąg słów jest zdaniem rozpoznawanym przez gramatykę, jeżeli wiązaniauda się połączyć w graf spełniający następujące warunki:

planarność – wiązania nie przecinają się;łączliwość – wiązania wystarczają do połączenia wszystkich słówzdania;spełnialność – połączenia spełniają wszystkie wymagania nakładaneprzez wiązania słów w zdaniu.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (267 / 272)

Link Grammar

..LEFT-WALL. John.b. has.v. read.v. the. book.n. ..Wd

.Ss

.PP

.Ds

.

Os

.

Xp

..LEFT-WALL. has.v. John.b. read.v. the. book.n. ..Qd

.SIs

.

PP

.Ds

.

Os

.

Xp

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (268 / 272)

Link Grammar

..LEFT-WALL. which. book.n. has.v. John.b. read.v. ?.Wq

.Ds*w

.Rw

.SIs

.

PP

.

Bsm

.

Xp

..LEFT-WALL. which. book.n. has.v. John.b. read.v. ?.Ws

.Ds*w

.Ss

.Os

.

Pv

.

Xp

..LEFT-WALL. which. book.n. has.v. John.b. read.v. ?.Ws

.Ds*w

.Ss

.Os

.

I*j

.

Xp

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (269 / 272)

Definite Clause Grammar

DCG jest rodzajem gramatyki metamorficznej. Jest ściśle związana zkonkretnym językiem programowania – prologiem. Nie oznacza to, że niemożna pisać analizatorów składniowych innych gramatyk w prologu, np.Alpino – analizator składniowy HPSG dla języka niderlandzkiego – jestnapisany właśnie w prologu.Jedyna do niedawna pełna gramatyka języka polskiego (napisana przezStanisława Szpakowicza, a rozwijana także przez Marka Świdzińskiego) jestgramatyką DCG.

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (270 / 272)

Literatura dotycząca składni

Andrew Radford, Transformational Grammar. A First Course,Cambridge Textbooks in Linguistics, Cambridge University Press,1988.Cheryl A. Black, A Step-by-Step Introduction to the Government andBinding Theory of Syntax, Summer Institute of Linguistics, 1999.Dostępne pod:http://www.sil.org/americas/mexico/ling/E002-IntroGB.pdfJoan Bresnan, Lexical-Functional Syntax, Blackwell, 2001.Mary Dalrymple, Lexical Functional Grammar, San Diego: AcademicPress, 2001.Magdalene Grantson, Lexical Functional Grammar: Analysis andImplementation, raport techniczny, Lund University, 2002. Dostępnepod:http://www.cs.lth.se/EDA171/Reports/2001/magdalene.pdf

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (271 / 272)

Literatura dotycząca składni

Carl Pollard, Ivan A. Sag,Head-Driven Phrase Structure Grammars,University of Chicago Press, 1994.Adam Przepiórkowski, Anna Kupść, Małgorzata Marciniak, AgnieszkaMykowiecka, Formalny opis języka polskiego. Teoria i implementacja,Akademicka Oficyna Wydawnicza Exit, Warszawa 2002.Stefan Müller, Head-Driven Phrase Structure Grammar. EineEinführung, Stauffenburg Einführungen Nr. 17, Tübingen:Stauffenburg Verlag, 2008. Dostępne pod:http://hpsg.fu-berlin.de/~stefan/Pub/hpsg-lehrbuch.htmlDaniel Sleator, Davy Temperley, Parsing English with a LinkGrammar, Third International Workshop on Parsing Technologies,1993. Dostępny pod:http://www.cs.cmu.edu/afs/cs.cmu.edu/project/link/pub/www/papers/ps/LG-IWPT93.pdf

Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (272 / 272)