16
NLU/RG , pt. 8 Константин Соколов Mathlingvo, СПбГУ, i-Free http://nlu-rg.ru Санкт-Петербург, 2013

Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Embed Size (px)

DESCRIPTION

Доклад на семинаре Natural Language Understanding Reading Group (http://nlu-rg.ru)

Citation preview

Page 1: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

NLU/RG , pt. 8

Константин Соколов

Mathlingvo, СПбГУ, i-Free

http://nlu-rg.ru

Санкт-Петербург, 2013

Page 2: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

План

• сегодня: Р. Монтегю, универсальная грамматика• в следующий раз: PTQ Framework

1

Page 3: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Предварительные замечания

• Три “лингвистические” работы Монтегю• English as a Formal Language (1970)• Universal Grammar (1970)• Proper Treatment of Quantification in Ordinary English (1971)

• “Универсальная грамматика”• у Монтегю – сформулированная в максимальной общности

(ср. “универсальная алгебра”)• у Хомского – лежащая в основе любого естественного

языка

2

Page 4: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Алгебра (1)

Пример алгебры:

Пусть X - множество, 2X - множество подмножеств X .Алгебра множеств - это система подмножеств A ⊆ 2X ,таких что:

• ∅ ∈ A• если A ∈ A, то X \A ∈ A• если A ∈ A и B ∈ A, то A ∪ B ∈ A

3

Page 5: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Алгебра (2)

Сигнатура или тип подобия - это тройка σ = (Sfunc , Srel , ar)

• Sfunc - набор функциональных символов (напр.: +,×, 0, 1)• Srel - множество реляционных символов (напр.: ∈,≤)• ar - функция арности: Sfunc ∪ Srel → N

Структура - это тройка A = (A, σ, I ), где A - домен (носитель),σ - сигнатура, I - функция интерпретации сигнатуры в домене.

Структура, определяемая языком с сигнатурой, содержащейтолько функциональные символы, называется алгеброй.

4

Page 6: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Универсальная грамматика (1)

• Р. Монтегю определяет формальный язык, порождающийстроки (собственные выражения, proper expressions),

• снабжает множество собственных выражений структуройалгебры путем задания структурных операций Fγ ,

• определяет множество осмысленных выражений как“правильно типизированное” подмножество собственныхвыражений (следуя К. Айдукевичу),

• определяет интерпретацию как отображение из множестваосмысленных выражений в множество значений,сопоставляющее структурным операциям формальногоязыка операции семантической композиции(т.е. гомоморфизм алгебр).

5

Page 7: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Универсальная грамматика (2)

Формальный язык строится как типизированное исчисление.

Чтобы задать формальную систему, нужно:

• задать набор символов и правила построения выражений• определить правила вывода• задать набор аксиом• определить понятие выводимости

6

Page 8: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Универсальная грамматика (3)

Терминальные символы и выражения формального языка:

• ограниченный лексикон, т.е. слова• структурные операции, напр.

• F1(α, β) = αβ• F2(α) = every α• F3(α) = not α• F4,n(ζ, φ) = ζ such that φ′, где φ′ получен из φ заменой всех

вхождений hen на hern, если первое слово в ζ - типа CN иженского рода (неточный фрагмент операции из PTQ)

7

Page 9: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Универсальная грамматика (4)

“Аксиомы”:

• определяются синтаксические категории (по Айдукевичу)• элементарные: e (entities), t (truth values)• производные: t/e, t/e/t/e и т.п.

• задаются наборы базовых выражений, относящихся кконкретным синтаксическим категориям.

Замечание: у Айдукевича было n вместо e, s вместо t.

8

Page 10: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Универсальная грамматика (5)

Понятие “выводимости”:

• определяется рекурсивными правилами в соответствии соструктурными операциями с учетом синтаксическихкатегорий.

• <Fγ , <α1, α2, ..., αn>, ε>, где αi - типы аргументов, ε -тип результата структурной операции Fγ ;

• дерево вывода предложения соответствует егосинтаксической структуре;

• имеется выделенная синтаксическая категория t для“ассерторических высказываний”.

9

Page 11: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Интерпретация (1)

Цель - построить интерпретацию формального языка,удовлетворяющую принципу композициональности.

Монтегю определяет семантическую интерпретацию какгомоморфизм алгебр из “алгебры синтаксиса” в “алгебрусемантики”.

“Алгебры семантики” у нас ещё нет.

10

Page 12: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Интерпретация (2)

“Алгебру семантики” можно восстановить, определивсемантические типы и построив отображение g изсинтаксических категорий в семантические типы:

• g(e) =<e>• g(t) =< t>• g(t/e) =<e, t>• g(t/e/t/e) =<<e, t>,<e, t>>• и т. д.

g не обязательно биективно (в PTQ g(A/B) = g(A//B)).

11

Page 13: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Интерпретация (3)

Тогда интерпретация f :

• отображает базовые выражения некоторой синтаксическойкатегории в денотаты соответствующего ей типа приотображении g :

• если α - типа γ, то [[α]] = f (α) ∈ g(γ)• природа денотатов не уточняется

• сопоставляет структурым операциям операциисемантической композиции:

• f (Fγ(α1 : τ1, α2 : τ2, ..., αn : τn) : ε =f (Fγ)(f (α1) : g(τ1), f (α2) : g(τ2), ..., f (αn) : g(τn)) : g(ε)

12

Page 14: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Интерпретация (4)

Замечания:

• мы контролируем отображение g и можем сделать еготаким, как нам нужно;

• построенная алгебра содержит много лишнего, насинтересуют только “корректно типизированные”фрагменты;

• структурные операции могут определяться как схемыаксиом, т. е. множество синтаксических правил не обязанобыть конечным.

13

Page 15: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Интерпретация (5)

• Множество возможных денотатов E и функцияозначивания f образуют модель <E , f >

• Индексы: множество возможных миров I и множествомоментов времени J.

• Множество J снабжается структурой линейного порядка.• Пара (i , j) ∈ I × J обозначает точку отнесенности (point ofreference)

• Модальные операторы �, H, W

14

Page 16: Универсальная грамматика Р. Монтегю (NLU/RG, 26 декабря 2013)

Спасибо!