47
СЕМАНТИЧНО МОДЕЛИРАНЕ НА БЪЛГАРСКИТЕ ЧАСТИ НА РЕЧТА (В ОПОРНАТА ФРАЗОВА ГРАМАТИКА) Петя Осенова Катедра по български език СУ „Св. Кл. Охридски”

Семантично моделиране на българските части на речта ( в Опорната фразова граматика )

  • Upload
    azura

  • View
    60

  • Download
    1

Embed Size (px)

DESCRIPTION

Семантично моделиране на българските части на речта ( в Опорната фразова граматика ). Петя Осенова Катедра по български език СУ „Св. Кл. Охридски”. План. Общи положения в Опорната фразова граматика (ОФГ) Идеите за кодиране на информация в лексикона (Полард и Саг 1994; Пустейовски 1998) - PowerPoint PPT Presentation

Citation preview

Page 1: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

СЕМАНТИЧНО МОДЕЛИРАНЕ НА БЪЛГАРСКИТЕ ЧАСТИ НА РЕЧТА

(В ОПОРНАТА ФРАЗОВА ГРАМАТИКА)

Петя ОсеноваКатедра по български език

СУ „Св. Кл. Охридски”

Page 2: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПЛАН Общи положения в Опорната фразова

граматика (ОФГ) Идеите за кодиране на информация в лексикона

(Полард и Саг 1994; Пустейовски 1998) Моделиране на частите на речта

Пълнозначни (съществително име, прилагателно име, числително име, наречие, местоимения, глагол)

Функционални (предлог, съюз, частица)

Page 3: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ОБЩИ ПОЛОЖЕНИЯ (1): ОФГ (HEAD-DRIVEN PHRASE STRUCTURE GRAMMAR) съвременна лингвистична теория информацията за езиковите обекти се кодира в

йерархия на типовете със съответните ограничения, граматични правила и лексикон

oсобено важна е ролята на лексикона, където се представят подробности за граматическото и семантичното поведение на лексемите

Page 4: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )
Page 5: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )
Page 6: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ОБЩИ ПОЛОЖЕНИЯ (2) Лингвистичната информация се наследява от

по-общ тип към по-специфичен тип Кодирането показва взаимодействието между

морфосинтаксис, семантика и прагматика Например: интранзитивният глагол ще наследи

информация от общата спецификация за глагола, като добави допълнителни ограничения за това, че няма комплементи във валентната си рамка

(повече за ОФГ вж. Формална граматика на българския език – Осенова и Симов 2007)

Page 7: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ОБЩИ ПОЛОЖЕНИЯ (3) Mорфосинтактичната информация се кодира в

характеристиката Категория (CAT(egory)). Тя включва: подхарактеристиките за част на речта и валентност

Семантичната информация се кодира в характеристиката Съдържание (CONT(ent)). Тя включва: семантичната подхарактеристика Индекс (INDEX), която има за стойност събитие (event) или референт (referent).

Page 8: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

8

ПРИМЕР

individual := semarg & [ SORT semsort ].

event-or-ref-index := individual.

ref-ind := index & event-or-ref-index & [ PNG png ].

Page 9: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )
Page 10: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ОБЩИ ПОЛОЖЕНИЯ (4) Частите на речта се категоризират като:

събития (глаголи, предлози, прилагателни, наречия) и референти (съществителни)

Опорите се разделят на местоименни и неместоименни

Някои части на речта въвеждат специфични семантични релации

Page 11: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

Известно е, че българският език е флективен език с богата морфология.

Затова и семантичното моделиране е тясно свързано с граматическите процеси.

Представени са някои особености при моделиране на частите на речта от гледна точка на семантиката.

Page 12: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

AРГУМЕНТНА СТРУКТУРАVS. ВАЛЕНТНИ СПИСЪЦИ (ОФГ) Аргументната структура (ARG-ST) кодира

потенциалните задължителни участници в ситуацията в подреден списък. Следва йерархията за ‘косвеност’ (obliqueness hierarchy). <NP1, NP2, PP>

Валентните списъци кодират проекциите на аргументната структура, които са реализирани синтактично

Така връзката между двете равнища е: Съществува в ARG-ST и се реализира във валентния

списък Съществува в ARG-ST, но не се реализира във валентния

списък

Page 13: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПУСТЕЙОВСКИ И НЕГОВИЯТ “ГЕНЕРАТИВЕН ЛЕКСИКОН” Типове аргументи:

Истински (реализира се синтактично)По подразбиранеВ сянкаАдюнкт

Типове качества:AGENTIVE (произход), CONSTITUTIVE (съдържание), TELIC (цел), FORMAL (специфика)

Page 14: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

FORMAL QUALIAбратARGST = [ARG0 = x:човек]

[D-ARG = y:човек]Qualia = [CONST = мъж (x)] [FORMAL = брат_на(x,y)]

Page 15: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

CONSTITUTIVE QUALIAръкаARGST = [ARG0 = x:крайник]

[D-ARG = y:човек]Qualia = [FORMAL = x] [CONST = част_от(x,y:тяло)]

Page 16: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

TELIC И AGENTIVEхондаARGST = [ARG0 = x:кола]Qualia = [FORMAL = x] [TELIC = карам(е,y,x)]

[AGENTIVE = създавам(е,хонда,x)]

Page 17: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

СЪЩЕСТВИТЕЛНИ ИМЕНА Нарицателни и собствени Разделяне на категориите лице/число/род от

категорията определеност/неопределеност По принцип НЕ са модификатори Релационните съществителни имат семантичен

аргумент (майка на X) Собствените имена въвеждат релация за

именуване

Page 18: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

СТРУКТУРА НА БАЗИСНО СЪЩЕСТВИТЕЛНО ИМЕSYNSEM [ LOCAL [ CAT

[ HEAD noun [MOD <>], VAL [ SPR <det> ], SUBJ < >, SPEC < > ]],

AGR.PNG #png & [ PERSON 3rd ], CONT [ INDEX [ PNG #png ]

Page 19: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

СТРУКТУРА НА КОНКРЕТНО СЪЩЕСТВИТЕЛНО И НА СОБСТВЕНО ИМЕ

n_-_cm-hum_le := basic-common-noun-masc-intr &[SYNSEM.LOCAL.CONT.HOOK.INDEX.SORT

human ].

basic-proper-noun := basic-common-noun-intr & [ SYNSEM.LKEYS.KEYREL named-relation

].

Page 20: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

НАЧАЛНА ЙЕРАРХИЯ НА СЕМАНТИЧНИТЕ СОРТОВЕ

Page 21: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПРИМЕРИ ЗА СЪЩЕСТВИТЕЛНИ, КОИТО МОДИФИЦИРАТ

Кучето лаеше всеки ден. (модифициране на събитие)

Браун пристигна във вторник сутринта. (модифициране на референт)

Page 22: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПРИЛАГАТЕЛНИ ИМЕНА Типичното прилагателно е:

„Пресичащ“ модификатор (intersective) Събитие Не взима комплементи

Компаративното прилагателно въвежда релация за сравнителна степен

Page 23: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

„Пресичащ“ модификатор означава, че семантично се стеснява обемът на модифицираното понятие.

Например: хубава жена, висок човек. „Пресичащите“ модификатори действат

директно върху семантиката на модифицираното понятие.

Page 24: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

Освен „пресичащи“ модификатори, има и т.нар. модификатори с обхват.

Те не стесняват понятиeто, а се отнасят към цялостно събитие.

Това означава, че се въвеждат ограничения, в рамките на които прилагателните имена с обхват влизат в отношения и с други квантификатори.

Например в израза бивш военен, прилагателното бивш не се отнася до множество на бивши обекти, а до времеви момент, който предхожда настоящия момент.

Page 25: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

КОНФЛИКТ МЕЖДУ МОРФОСИНТАКСИС И СЕМАНТИКА: ОПРЕДЕЛИТЕЛНИЯТ ЧЛЕН Тъй като събитията не могат да бъдат

определени или не, прилагателното може да бъде морфологично определено, но семантично то избира определено съществително:

Напр. старата коткаСтарата [MOD < котка >] котка [SYNSEM.LOCAL [CONT.HOOK.INDEX.DEF+].

AGR.DEF-]]

Page 26: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ЧИСЛИТЕЛНИ ИМЕНА Числителните имена (бройни и редни) се

разглеждат като „пресичащи“ модификатори. Разликата е единствено в типа на съгласуването

с опорната дума.

Page 27: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

НАРЕЧИЯ Разделят се на:

‘пресичащи се’ (тихо, весело, сега) и ‘имащи обхват’ (вероятно)

Page 28: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

МЕСТОИМЕНИЯ: КАТЕГОРИЗИРАЩ ПРИЗНАК

Page 29: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

МЕСТОИМЕНИЯ: СЕМАНТИЧНИ РЕЛАЦИИ

Page 30: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

МЕСТОИМЕНИЯ Притежателните – въвеждат релация за

посесивност с два аргумента Относителните – нямат характеристиката за

модификатор (MOD) и нямат своя семантика. Семантиката е на нивото на конструкцията.

Местоименията-детерминатори въвеждат квантифицираща релация.

Въпросителните – и въпросителна релация.

Page 31: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

31

КЛИТИКИТЕ, ДУБЛИРАЩИ АРГУМЕНТИ Клитиките се разглеждат като лексикални проекциина опората Пълните форми се разглеждат като аргументи Т.е. клитиките нямат своя семантика. Те я инкорпорират в опората.

Page 32: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПРИМЕРИ [VP Иван [V го видяха]]

[V Взеха я]

[VP Видяха Иван]

Page 33: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ГЛАГОЛИ Глаголите имат редица типологически значими

характеристики, които могат да поделят своя граматически и семантичен принос.

Такива са например категориите: вид, време, наклонение.

Page 34: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ГЛАГОЛИperfective-or-imperfective-lexeme := main-verb-lex &

[ SYNSEM.LOCAL[CAT.HEAD.TAM.ASPECT #aspect, CONT.HOOK.INDEX.E.ASPECT

#aspect ]].

Page 35: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

Семантиката на глагола зависи от три основни фактора: разделението на спомагателни и пълнозначни

глаголи; синтактичният тип на глагола: интранзитивен

(вървя), транзитивен (гледам), дитранзитивен (давам) и

дали глаголът изразява определен тип контрол от типа подлог-подлог ((АЗ)обещавам (АЗ) да направя нещо), пряк обект-подлог ((АЗ) убеждавам (НЯКОГО) (ТОЙ) да направи нещо) и др.

Page 36: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

спомагателните глаголи, които образуват глаголни форми, нямат своя семантика.

затова те приемат семантиката на своя аргумент.

Например: Той беше пренесъл багажа в къщата.

Page 37: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

КОПУЛА Семантични разлики според комплемента:Взема референта като комплемент и се държи като транзитивен глагол

Аз съм човек. Взема събитието, като то дава семантичния си индекс

Аз съм добра. Аз съм добре. Аз съм от Плевен.

Page 38: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

Моделиране на функционалните думи

Page 39: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПРЕДЛОЗИ Два типа:

Модифициращи (имат семантика) Немодифициращи (нямат семантика)

Примери В градината имаше котки. Дадох книгата на Иван.

Page 40: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )
Page 41: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

СЪЮЗИ Субординатори (модифицират главното

изречение, но избират подчиненото) Комплементизатори (субкатегоризирани са от

главното изречение и също избират подчиненото)

Page 42: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПРИМЕР ЗА СУБОРДИНАТОР

Page 43: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ПРИМЕР ЗА КОМПЛЕМЕНТИЗАТОР

Page 44: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ЧАСТИЦИ доста разнородна група – с различен състав и

различна функция: въпросителната частица ли се разглежда като

„пресичащ“ модификатор, докато отрицателната частица нито се разглежда като

детерминатор, т.е. като част на речта, която има обхват

частицата се, която е част от глаголната лексема (смея се, боя се, дивя се) се разглежда логично като частица без собствена семантика

Page 45: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )
Page 46: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ЗАКЛЮЧЕНИЕ Селективните способности на частите на речта

предполагат по-детайлна семантична класификация и довеждат до появата на повече типове

Наличието или липсата на семантично съдържание зависи от самата част на речта, но и от субкатегоризиращия елемент

Много от граматичните характеристики поделят приноса си в морфосинтактичната и семантичната област

Page 47: Семантично моделиране на българските части на речта  ( в Опорната фразова граматика )

ЛИТЕРАТУРА Copestake, A. et. al (2005): A. Copestake, D. Flickinger, C. Pollard and I. Sag.

Minimal Recursion Semantics: An Introduction. In Research on Language and Computation (2005) 3:281–332.

Kathol, A. (1997): Agreement and the Syntax-Morphology Interface in HPSG. In Robert Levine and Georgia Green (eds.) Studies in Current Phrase Structure Grammar. Cambridge University Press. pp. 223-274.

Manning and Sag 1995: Ch. Manning and I. Sag. Dissociation between Argument Structure and Grammatical Relations. In: G. Webelhuth, J.-P. Koening and A. Kathol (eds.) Lexical and Constructional Aspects of Linguistic Explanation, CSLI publications, pp. 63–78.

Osenova 2004: Petya Osenova. On Subject-Verb Agreement in Bulgarian (An HPSG-based account). In: Proc. of the fourth Formal Description of Slavic Languages Conference, Potsdam, Germany, 2004. pages 661-672.

Osenova 2010: Bulgarian Resource Grammar. Modeling Bulgarian in HPSG. VDM, Saarbrucken.

Pustejovsky 1998: James Pustejovsky. The Generative Lexicon. The MIT Press. Cambridge, Massachusetts, London, England.