Семантично моделиране на българските части на речта (...

Preview:

DESCRIPTION

Семантично моделиране на българските части на речта ( в Опорната фразова граматика ). Петя Осенова Катедра по български език СУ „Св. Кл. Охридски”. План. Общи положения в Опорната фразова граматика (ОФГ) Идеите за кодиране на информация в лексикона (Полард и Саг 1994; Пустейовски 1998) - PowerPoint PPT Presentation

Citation preview

СЕМАНТИЧНО МОДЕЛИРАНЕ НА БЪЛГАРСКИТЕ ЧАСТИ НА РЕЧТА

(В ОПОРНАТА ФРАЗОВА ГРАМАТИКА)

Петя ОсеноваКатедра по български език

СУ „Св. Кл. Охридски”

ПЛАН Общи положения в Опорната фразова

граматика (ОФГ) Идеите за кодиране на информация в лексикона

(Полард и Саг 1994; Пустейовски 1998) Моделиране на частите на речта

Пълнозначни (съществително име, прилагателно име, числително име, наречие, местоимения, глагол)

Функционални (предлог, съюз, частица)

ОБЩИ ПОЛОЖЕНИЯ (1): ОФГ (HEAD-DRIVEN PHRASE STRUCTURE GRAMMAR) съвременна лингвистична теория информацията за езиковите обекти се кодира в

йерархия на типовете със съответните ограничения, граматични правила и лексикон

oсобено важна е ролята на лексикона, където се представят подробности за граматическото и семантичното поведение на лексемите

ОБЩИ ПОЛОЖЕНИЯ (2) Лингвистичната информация се наследява от

по-общ тип към по-специфичен тип Кодирането показва взаимодействието между

морфосинтаксис, семантика и прагматика Например: интранзитивният глагол ще наследи

информация от общата спецификация за глагола, като добави допълнителни ограничения за това, че няма комплементи във валентната си рамка

(повече за ОФГ вж. Формална граматика на българския език – Осенова и Симов 2007)

ОБЩИ ПОЛОЖЕНИЯ (3) Mорфосинтактичната информация се кодира в

характеристиката Категория (CAT(egory)). Тя включва: подхарактеристиките за част на речта и валентност

Семантичната информация се кодира в характеристиката Съдържание (CONT(ent)). Тя включва: семантичната подхарактеристика Индекс (INDEX), която има за стойност събитие (event) или референт (referent).

8

ПРИМЕР

individual := semarg & [ SORT semsort ].

event-or-ref-index := individual.

ref-ind := index & event-or-ref-index & [ PNG png ].

ОБЩИ ПОЛОЖЕНИЯ (4) Частите на речта се категоризират като:

събития (глаголи, предлози, прилагателни, наречия) и референти (съществителни)

Опорите се разделят на местоименни и неместоименни

Някои части на речта въвеждат специфични семантични релации

Известно е, че българският език е флективен език с богата морфология.

Затова и семантичното моделиране е тясно свързано с граматическите процеси.

Представени са някои особености при моделиране на частите на речта от гледна точка на семантиката.

AРГУМЕНТНА СТРУКТУРАVS. ВАЛЕНТНИ СПИСЪЦИ (ОФГ) Аргументната структура (ARG-ST) кодира

потенциалните задължителни участници в ситуацията в подреден списък. Следва йерархията за ‘косвеност’ (obliqueness hierarchy). <NP1, NP2, PP>

Валентните списъци кодират проекциите на аргументната структура, които са реализирани синтактично

Така връзката между двете равнища е: Съществува в ARG-ST и се реализира във валентния

списък Съществува в ARG-ST, но не се реализира във валентния

списък

ПУСТЕЙОВСКИ И НЕГОВИЯТ “ГЕНЕРАТИВЕН ЛЕКСИКОН” Типове аргументи:

Истински (реализира се синтактично)По подразбиранеВ сянкаАдюнкт

Типове качества:AGENTIVE (произход), CONSTITUTIVE (съдържание), TELIC (цел), FORMAL (специфика)

FORMAL QUALIAбратARGST = [ARG0 = x:човек]

[D-ARG = y:човек]Qualia = [CONST = мъж (x)] [FORMAL = брат_на(x,y)]

CONSTITUTIVE QUALIAръкаARGST = [ARG0 = x:крайник]

[D-ARG = y:човек]Qualia = [FORMAL = x] [CONST = част_от(x,y:тяло)]

TELIC И AGENTIVEхондаARGST = [ARG0 = x:кола]Qualia = [FORMAL = x] [TELIC = карам(е,y,x)]

[AGENTIVE = създавам(е,хонда,x)]

СЪЩЕСТВИТЕЛНИ ИМЕНА Нарицателни и собствени Разделяне на категориите лице/число/род от

категорията определеност/неопределеност По принцип НЕ са модификатори Релационните съществителни имат семантичен

аргумент (майка на X) Собствените имена въвеждат релация за

именуване

СТРУКТУРА НА БАЗИСНО СЪЩЕСТВИТЕЛНО ИМЕSYNSEM [ LOCAL [ CAT

[ HEAD noun [MOD <>], VAL [ SPR <det> ], SUBJ < >, SPEC < > ]],

AGR.PNG #png & [ PERSON 3rd ], CONT [ INDEX [ PNG #png ]

СТРУКТУРА НА КОНКРЕТНО СЪЩЕСТВИТЕЛНО И НА СОБСТВЕНО ИМЕ

n_-_cm-hum_le := basic-common-noun-masc-intr &[SYNSEM.LOCAL.CONT.HOOK.INDEX.SORT

human ].

basic-proper-noun := basic-common-noun-intr & [ SYNSEM.LKEYS.KEYREL named-relation

].

НАЧАЛНА ЙЕРАРХИЯ НА СЕМАНТИЧНИТЕ СОРТОВЕ

ПРИМЕРИ ЗА СЪЩЕСТВИТЕЛНИ, КОИТО МОДИФИЦИРАТ

Кучето лаеше всеки ден. (модифициране на събитие)

Браун пристигна във вторник сутринта. (модифициране на референт)

ПРИЛАГАТЕЛНИ ИМЕНА Типичното прилагателно е:

„Пресичащ“ модификатор (intersective) Събитие Не взима комплементи

Компаративното прилагателно въвежда релация за сравнителна степен

„Пресичащ“ модификатор означава, че семантично се стеснява обемът на модифицираното понятие.

Например: хубава жена, висок човек. „Пресичащите“ модификатори действат

директно върху семантиката на модифицираното понятие.

Освен „пресичащи“ модификатори, има и т.нар. модификатори с обхват.

Те не стесняват понятиeто, а се отнасят към цялостно събитие.

Това означава, че се въвеждат ограничения, в рамките на които прилагателните имена с обхват влизат в отношения и с други квантификатори.

Например в израза бивш военен, прилагателното бивш не се отнася до множество на бивши обекти, а до времеви момент, който предхожда настоящия момент.

КОНФЛИКТ МЕЖДУ МОРФОСИНТАКСИС И СЕМАНТИКА: ОПРЕДЕЛИТЕЛНИЯТ ЧЛЕН Тъй като събитията не могат да бъдат

определени или не, прилагателното може да бъде морфологично определено, но семантично то избира определено съществително:

Напр. старата коткаСтарата [MOD < котка >] котка [SYNSEM.LOCAL [CONT.HOOK.INDEX.DEF+].

AGR.DEF-]]

ЧИСЛИТЕЛНИ ИМЕНА Числителните имена (бройни и редни) се

разглеждат като „пресичащи“ модификатори. Разликата е единствено в типа на съгласуването

с опорната дума.

НАРЕЧИЯ Разделят се на:

‘пресичащи се’ (тихо, весело, сега) и ‘имащи обхват’ (вероятно)

МЕСТОИМЕНИЯ: КАТЕГОРИЗИРАЩ ПРИЗНАК

МЕСТОИМЕНИЯ: СЕМАНТИЧНИ РЕЛАЦИИ

МЕСТОИМЕНИЯ Притежателните – въвеждат релация за

посесивност с два аргумента Относителните – нямат характеристиката за

модификатор (MOD) и нямат своя семантика. Семантиката е на нивото на конструкцията.

Местоименията-детерминатори въвеждат квантифицираща релация.

Въпросителните – и въпросителна релация.

31

КЛИТИКИТЕ, ДУБЛИРАЩИ АРГУМЕНТИ Клитиките се разглеждат като лексикални проекциина опората Пълните форми се разглеждат като аргументи Т.е. клитиките нямат своя семантика. Те я инкорпорират в опората.

ПРИМЕРИ [VP Иван [V го видяха]]

[V Взеха я]

[VP Видяха Иван]

ГЛАГОЛИ Глаголите имат редица типологически значими

характеристики, които могат да поделят своя граматически и семантичен принос.

Такива са например категориите: вид, време, наклонение.

ГЛАГОЛИperfective-or-imperfective-lexeme := main-verb-lex &

[ SYNSEM.LOCAL[CAT.HEAD.TAM.ASPECT #aspect, CONT.HOOK.INDEX.E.ASPECT

#aspect ]].

Семантиката на глагола зависи от три основни фактора: разделението на спомагателни и пълнозначни

глаголи; синтактичният тип на глагола: интранзитивен

(вървя), транзитивен (гледам), дитранзитивен (давам) и

дали глаголът изразява определен тип контрол от типа подлог-подлог ((АЗ)обещавам (АЗ) да направя нещо), пряк обект-подлог ((АЗ) убеждавам (НЯКОГО) (ТОЙ) да направи нещо) и др.

спомагателните глаголи, които образуват глаголни форми, нямат своя семантика.

затова те приемат семантиката на своя аргумент.

Например: Той беше пренесъл багажа в къщата.

КОПУЛА Семантични разлики според комплемента:Взема референта като комплемент и се държи като транзитивен глагол

Аз съм човек. Взема събитието, като то дава семантичния си индекс

Аз съм добра. Аз съм добре. Аз съм от Плевен.

Моделиране на функционалните думи

ПРЕДЛОЗИ Два типа:

Модифициращи (имат семантика) Немодифициращи (нямат семантика)

Примери В градината имаше котки. Дадох книгата на Иван.

СЪЮЗИ Субординатори (модифицират главното

изречение, но избират подчиненото) Комплементизатори (субкатегоризирани са от

главното изречение и също избират подчиненото)

ПРИМЕР ЗА СУБОРДИНАТОР

ПРИМЕР ЗА КОМПЛЕМЕНТИЗАТОР

ЧАСТИЦИ доста разнородна група – с различен състав и

различна функция: въпросителната частица ли се разглежда като

„пресичащ“ модификатор, докато отрицателната частица нито се разглежда като

детерминатор, т.е. като част на речта, която има обхват

частицата се, която е част от глаголната лексема (смея се, боя се, дивя се) се разглежда логично като частица без собствена семантика

ЗАКЛЮЧЕНИЕ Селективните способности на частите на речта

предполагат по-детайлна семантична класификация и довеждат до появата на повече типове

Наличието или липсата на семантично съдържание зависи от самата част на речта, но и от субкатегоризиращия елемент

Много от граматичните характеристики поделят приноса си в морфосинтактичната и семантичната област

ЛИТЕРАТУРА Copestake, A. et. al (2005): A. Copestake, D. Flickinger, C. Pollard and I. Sag.

Minimal Recursion Semantics: An Introduction. In Research on Language and Computation (2005) 3:281–332.

Kathol, A. (1997): Agreement and the Syntax-Morphology Interface in HPSG. In Robert Levine and Georgia Green (eds.) Studies in Current Phrase Structure Grammar. Cambridge University Press. pp. 223-274.

Manning and Sag 1995: Ch. Manning and I. Sag. Dissociation between Argument Structure and Grammatical Relations. In: G. Webelhuth, J.-P. Koening and A. Kathol (eds.) Lexical and Constructional Aspects of Linguistic Explanation, CSLI publications, pp. 63–78.

Osenova 2004: Petya Osenova. On Subject-Verb Agreement in Bulgarian (An HPSG-based account). In: Proc. of the fourth Formal Description of Slavic Languages Conference, Potsdam, Germany, 2004. pages 661-672.

Osenova 2010: Bulgarian Resource Grammar. Modeling Bulgarian in HPSG. VDM, Saarbrucken.

Pustejovsky 1998: James Pustejovsky. The Generative Lexicon. The MIT Press. Cambridge, Massachusetts, London, England.

Recommended