Upload
duongtuyen
View
217
Download
0
Embed Size (px)
Citation preview
Składnia
Składnia to nauka o związkach wyrazów w zdaniu, szyku wyrazów iroli pełnionej przez wyrazy.Zapis składni powinien w łatwy sposób umożliwiać jej opis iwykorzystanie w automatycznej analizie zdania.Analiza składniowa dostarcza informacji o związkach wyrazów wzdaniu, najczęściej w postaci drzewa.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272)
Klasyfikacja opisów składni
Ze względu na zakres:z szerokim pokryciemspecjalizowane
Ze względu na rodzaj opisywanych zależności:wyodrębniające części zdaniazależnościowe
Ze względu na sposób przechowywania reguł składniowych:zleksykalizowanebez leksykalizacji
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (249 / 272)
Gramatyki transformacyjne
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (250 / 272)
Gramatyki transformacyjne
..XP.
spec.
.
X’
.
X
.
dopełnienia
X (także X0) – element główny (ang. head), XP (także X′′, X, X2) – frazaX („P” w angielskim pochodzi od phrase, po angielsku XP jest nazywanemaximal projection (of X), X′ (także X – intermediate projection) –kategoria pośrednia.Reguły:
XP→ Spec. X′
X′ → X dopełnieniaJan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (251 / 272)
Gramatyki transformacyjne
..CP[+q].
C′
.
C[+q]
.
IP
.
NP∆
John
.
I′
.
I[+fin]
.
VP
.
V′
.
V[+aux]|
has
.
VP[+en]
.
V′
.
V[+en]|
read
.
NP∆
the book
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (252 / 272)
Gramatyki transformacyjne
..CP[+q].
C′
.
V[+aux]|
hasi
.
IP
.
NP∆
John
.
I′
.
I[+fin]|ti
.
VP
.
V′
.
V[+aux]|ti
.
VP[+en]
.
V′
.
V[+en]|
read
.
NP∆
the book
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (253 / 272)
Gramatyki transformacyjne
..CP[+q]..
C′
.
C[+q]
.
IP
.
NP∆
John
.
I′
.
I[+fin]
.
VP
.
V′
.
V[+aux]|
has
.
VP[+en]
.
V′
.
V[+en]|
read
.
NP[+wh]
.
D[+wh]|
which
.
N′
.
N
.
book
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (254 / 272)
Gramatyki transformacyjne
..CP[+q].NP[+wh]
∆which booki
.
C′
.
C[+q]|
hasj
.
IP
.
NP∆
John
.
I′
.
I[+fin]|tj
.
VP
.
V′
.
V[+aux]|tj
.
VP[+en]
.
V′
.
V[+en]|
read
.
NP[+wh]
.
ti
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (255 / 272)
Lexical-Functional Grammar
Analiza zdania w tej gramatyce opiera się na dwóch strukturach:c-structure (z ang. constituent structure) if-structure (z ang. functional structure).
C-structure ma postać drzew uzyskanych z użyciem gramatykibezkontekstowej. Może mieć różną postać w różnych językach. F-structurema postać par (cecha, wartość) i reprezentuje powiązania często odległychod siebie fragmentów zdania.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (256 / 272)
Lexical-Functional Grammar
..S1.
S(↑=↓)
.
NP(↑ subj =↓)
.
NNP(↑=↓)
.
..John( ..↑ pred =′ john′
.. ..↑ num = sg
.. ..↑ pers = 3)
.
VP(↑=↓)
.
VBZ(↑=↓)
.
..has( ..↑ pred =′ have′)
.
..VP ..↑ xcomp =↓
.. ..↑ obj =↓ obj
.
VBN(↑=↓)
.
..read( ..↑ pred =′ read′
.. ..↑ tense = past)
.
NP(↑ obj =↓)
.
DT(↑ spec:det =↓)
.
the(↑ pred =′ the′)
.
NN(↑=↓)
.
..book( ..↑ pred =′ book′
.. ..↑ num = sg
.. ..↑ pers = 3)
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (257 / 272)
Lexical-Functional Grammar
..S1.
S(↑=↓)
.
NP(↑ subj =↓)
.
NNP(↑=↓)
.
..John( ..↑ pred =′ john′
.. ..↑ num = sg
.. ..↑ pers = 3)
.
VP(↑=↓)
.
VBZ(↑=↓)
.
..has( ..↑ pred =′ have′)
.
..VP ..↑ xcomp =↓
.. ..↑ obj =↓ obj
.
VBN(↑=↓)
.
..read( ..↑ pred =′ read′
.. ..↑ tense = past)
.
NP(↑ obj =↓)
.
DT(↑ spec:det =↓)
.
the(↑ pred =′ the′)
.
NN(↑=↓)
.
..book( ..↑ pred =′ book′
.. ..↑ num = sg
.. ..↑ pers = 3)
. wszystkie cechy dzielone z wyższym węzłem.
cecha pred dzielona z wyższym węzłem
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (258 / 272)
Lexical-Functional Grammar
..S1.
S(↑=↓)
.
AUX(↑=↓)
.
Has(↑ pred =′ has′)
.
NP(↑ subj =↓)
.
NNP(↑=↓)
.
..John( ..↑ pred = John′
.. ..↑ num = sg
.. ..↑ pers = 3)
.
VP(↑ xcomp =↓, ↑ obj =↓ obj)
.
VB(↑=↓)
.
read(↑ pred =′ read′)
.
NP(↑ obj =↓)
.
DT(↑ spec:det =↓)
.
the(↑ pred =′ the′)
.
NN(↑=↓)
.
..book( ..↑ pred =′ book′
.. ..↑ num = sg
.. ..↑ pers = 3)
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (259 / 272)
Head-Driven Phrase Structure Grammar
HPSG wywodzi się z GPSG (ang. Generalized Phrase StructureGrammar).Gramatyka zleksykalizowana – informacje o łączliwości słów wsłowniku.Gramatyka unifikacyjna – poszczególne obiekty posiadają cechy, naktóre można nakładać ograniczenia odwzorowujące zjawiskazachodzące w języku.Część ograniczeń jest zapisywana bezpośrednio za pomocąwspółdzielenia cech.Część ograniczeń wynika z ogólnych zasad, takich jak zasada elementugłównego, zasada struktury argumentów, czy zasada walencji.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (260 / 272)
Head-Driven Phrase Structure Grammar
wordphon
⟨dał
⟩
ss | lc
local
cat
category
head 1
verbgender mascperson 3rdnumber sg
val
valencesubj
⟨1
⟩comps
⟨2 , 3
⟩
arg-st⟨
1NP[nom] 4 , 2NP[dat] 5 , 3NP[acc] 6⟩
cont
givegiver 4
given 6
recipient 5
Zarówno słowa,jak i zdania sąopisywane przezstruktury cech.
Współdzieleniewartości cechzapisywane jest zapomocą liczb wkwadratach, np.1 : wartość cechySS|LC|CAT|HEADjest tożsamawartością cechySS|LC|CAT|VAL|SUBJ.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (261 / 272)
Tree Adjoining Grammar
Gramatyka istnieje w wielu wersjach (XTAG, LTAG, …), dla których istniejąróżne analizatory składniowe. Podstawowe cechy:
Z każdym słowem w słowniku związane jest drzewo określającemiejsce słowa w zdaniu – rolę, jaką pełni w składni.Każde podstawowa struktura (w TAG – drzewo) posiada co najmniejjeden symbol końcowy (słowo). Innymi słowy: TAG jest gramatykązleksykalizowaną.Przy dokonywaniu analizy składniowej zdania wykonuje się dwieoperacje na drzewach:
zastępowanie (ang. substitution)dołączanie (ang. adjunction)
Na każdą z operacji można nałożyć dodatkowe warunki za pomocąunifikacji.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (262 / 272)
Tree Adjoining Grammar – Zastępowanie
Jeden z liści drzewa jest zastępowany poddrzewem o tej samej etykiecie.
..DP.John
..DP.a book
..IP.DP
.I′
.
I
.
VP
.
V
.
reads
.
DP
W wyniku zastępowania dokonanego na liściach trzeciego drzewaotrzymamy:
..IP.DP
.
John
.I′
.
I
.
VP
.
V
.
reads
.
DP
.
a book
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (263 / 272)
Tree Adjoining Grammar – dołączanie
Podstawowe drzewa dzielimy na dwie kategorie:...1 pomocnicze: korzeń drzewa ma tę samą etykietę (kategorię) cowyznaczony liść drzewa
...2 początkowe: wszystkie inneDołączanie polega na wstawieniu drzewa pomocniczego o korzeniu A zetykietą X i wyznaczonym liściem B o tej samej etykiecie do innego drzewaw miejsce węzła C o etykiecie X w taki sposób, że rodzic węzła C staje sięrodzicem węzła A, a dzieci węzła C stają się dziećmi węzła B.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (264 / 272)
Tree Adjoining Grammar – dołączanie..IP.
DP.
John
.I′
.
I
.
VP
.
V
.
reads
.
DP
.
a book
..VP.
patiently
.
VPPo operacji dołączenia otrzymamy:
..IP.
DP
.
John
.
I′
.
I
.
VP
.
patiently
.
VP
.
V
.
reads
.
DP
.
a bookJan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (265 / 272)
Link Grammar
W tej gramatyce słowa w słowniku wyposażone są w zestawyuporządkowanych, nazwanych wiązań. Wiązania dzielą się na lewostronne(łączą się z wiązaniami innych słów leżących w tekście na lewo od danegosłowa) i prawostronne (analogicznie). Lewo- i prawostronne wiązaniauporządkowane są pod względem odległości słów, z których wiązaniami sięłączą. Słowo może mieć kilka alternatywnych zestawów wiązań.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (266 / 272)
Link Grammar
Ciąg słów jest zdaniem rozpoznawanym przez gramatykę, jeżeli wiązaniauda się połączyć w graf spełniający następujące warunki:
planarność – wiązania nie przecinają się;łączliwość – wiązania wystarczają do połączenia wszystkich słówzdania;spełnialność – połączenia spełniają wszystkie wymagania nakładaneprzez wiązania słów w zdaniu.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (267 / 272)
Link Grammar
..LEFT-WALL. John.b. has.v. read.v. the. book.n. ..Wd
.Ss
.PP
.Ds
.
Os
.
Xp
..LEFT-WALL. has.v. John.b. read.v. the. book.n. ..Qd
.SIs
.
PP
.Ds
.
Os
.
Xp
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (268 / 272)
Link Grammar
..LEFT-WALL. which. book.n. has.v. John.b. read.v. ?.Wq
.Ds*w
.Rw
.SIs
.
PP
.
Bsm
.
Xp
..LEFT-WALL. which. book.n. has.v. John.b. read.v. ?.Ws
.Ds*w
.Ss
.Os
.
Pv
.
Xp
..LEFT-WALL. which. book.n. has.v. John.b. read.v. ?.Ws
.Ds*w
.Ss
.Os
.
I*j
.
Xp
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (269 / 272)
Definite Clause Grammar
DCG jest rodzajem gramatyki metamorficznej. Jest ściśle związana zkonkretnym językiem programowania – prologiem. Nie oznacza to, że niemożna pisać analizatorów składniowych innych gramatyk w prologu, np.Alpino – analizator składniowy HPSG dla języka niderlandzkiego – jestnapisany właśnie w prologu.Jedyna do niedawna pełna gramatyka języka polskiego (napisana przezStanisława Szpakowicza, a rozwijana także przez Marka Świdzińskiego) jestgramatyką DCG.
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (270 / 272)
Literatura dotycząca składni
Andrew Radford, Transformational Grammar. A First Course,Cambridge Textbooks in Linguistics, Cambridge University Press,1988.Cheryl A. Black, A Step-by-Step Introduction to the Government andBinding Theory of Syntax, Summer Institute of Linguistics, 1999.Dostępne pod:http://www.sil.org/americas/mexico/ling/E002-IntroGB.pdfJoan Bresnan, Lexical-Functional Syntax, Blackwell, 2001.Mary Dalrymple, Lexical Functional Grammar, San Diego: AcademicPress, 2001.Magdalene Grantson, Lexical Functional Grammar: Analysis andImplementation, raport techniczny, Lund University, 2002. Dostępnepod:http://www.cs.lth.se/EDA171/Reports/2001/magdalene.pdf
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (271 / 272)
Literatura dotycząca składni
Carl Pollard, Ivan A. Sag,Head-Driven Phrase Structure Grammars,University of Chicago Press, 1994.Adam Przepiórkowski, Anna Kupść, Małgorzata Marciniak, AgnieszkaMykowiecka, Formalny opis języka polskiego. Teoria i implementacja,Akademicka Oficyna Wydawnicza Exit, Warszawa 2002.Stefan Müller, Head-Driven Phrase Structure Grammar. EineEinführung, Stauffenburg Einführungen Nr. 17, Tübingen:Stauffenburg Verlag, 2008. Dostępne pod:http://hpsg.fu-berlin.de/~stefan/Pub/hpsg-lehrbuch.htmlDaniel Sleator, Davy Temperley, Parsing English with a LinkGrammar, Third International Workshop on Parsing Technologies,1993. Dostępny pod:http://www.cs.cmu.edu/afs/cs.cmu.edu/project/link/pub/www/papers/ps/LG-IWPT93.pdf
Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (272 / 272)