Upload
konstantin-sokolov
View
360
Download
0
Embed Size (px)
DESCRIPTION
Доклад на семинаре Natural Language Understanding Reading Group (http://nlu-rg.ru)
Citation preview
NLU/RG , pt. 8
Константин Соколов
Mathlingvo, СПбГУ, i-Free
http://nlu-rg.ru
Санкт-Петербург, 2013
План
• сегодня: Р. Монтегю, универсальная грамматика• в следующий раз: PTQ Framework
1
Предварительные замечания
• Три “лингвистические” работы Монтегю• English as a Formal Language (1970)• Universal Grammar (1970)• Proper Treatment of Quantification in Ordinary English (1971)
• “Универсальная грамматика”• у Монтегю – сформулированная в максимальной общности
(ср. “универсальная алгебра”)• у Хомского – лежащая в основе любого естественного
языка
2
Алгебра (1)
Пример алгебры:
Пусть X - множество, 2X - множество подмножеств X .Алгебра множеств - это система подмножеств A ⊆ 2X ,таких что:
• ∅ ∈ A• если A ∈ A, то X \A ∈ A• если A ∈ A и B ∈ A, то A ∪ B ∈ A
3
Алгебра (2)
Сигнатура или тип подобия - это тройка σ = (Sfunc , Srel , ar)
• Sfunc - набор функциональных символов (напр.: +,×, 0, 1)• Srel - множество реляционных символов (напр.: ∈,≤)• ar - функция арности: Sfunc ∪ Srel → N
Структура - это тройка A = (A, σ, I ), где A - домен (носитель),σ - сигнатура, I - функция интерпретации сигнатуры в домене.
Структура, определяемая языком с сигнатурой, содержащейтолько функциональные символы, называется алгеброй.
4
Универсальная грамматика (1)
• Р. Монтегю определяет формальный язык, порождающийстроки (собственные выражения, proper expressions),
• снабжает множество собственных выражений структуройалгебры путем задания структурных операций Fγ ,
• определяет множество осмысленных выражений как“правильно типизированное” подмножество собственныхвыражений (следуя К. Айдукевичу),
• определяет интерпретацию как отображение из множестваосмысленных выражений в множество значений,сопоставляющее структурным операциям формальногоязыка операции семантической композиции(т.е. гомоморфизм алгебр).
5
Универсальная грамматика (2)
Формальный язык строится как типизированное исчисление.
Чтобы задать формальную систему, нужно:
• задать набор символов и правила построения выражений• определить правила вывода• задать набор аксиом• определить понятие выводимости
6
Универсальная грамматика (3)
Терминальные символы и выражения формального языка:
• ограниченный лексикон, т.е. слова• структурные операции, напр.
• F1(α, β) = αβ• F2(α) = every α• F3(α) = not α• F4,n(ζ, φ) = ζ such that φ′, где φ′ получен из φ заменой всех
вхождений hen на hern, если первое слово в ζ - типа CN иженского рода (неточный фрагмент операции из PTQ)
7
Универсальная грамматика (4)
“Аксиомы”:
• определяются синтаксические категории (по Айдукевичу)• элементарные: e (entities), t (truth values)• производные: t/e, t/e/t/e и т.п.
• задаются наборы базовых выражений, относящихся кконкретным синтаксическим категориям.
Замечание: у Айдукевича было n вместо e, s вместо t.
8
Универсальная грамматика (5)
Понятие “выводимости”:
• определяется рекурсивными правилами в соответствии соструктурными операциями с учетом синтаксическихкатегорий.
• <Fγ , <α1, α2, ..., αn>, ε>, где αi - типы аргументов, ε -тип результата структурной операции Fγ ;
• дерево вывода предложения соответствует егосинтаксической структуре;
• имеется выделенная синтаксическая категория t для“ассерторических высказываний”.
9
Интерпретация (1)
Цель - построить интерпретацию формального языка,удовлетворяющую принципу композициональности.
Монтегю определяет семантическую интерпретацию какгомоморфизм алгебр из “алгебры синтаксиса” в “алгебрусемантики”.
“Алгебры семантики” у нас ещё нет.
10
Интерпретация (2)
“Алгебру семантики” можно восстановить, определивсемантические типы и построив отображение g изсинтаксических категорий в семантические типы:
• g(e) =<e>• g(t) =< t>• g(t/e) =<e, t>• g(t/e/t/e) =<<e, t>,<e, t>>• и т. д.
g не обязательно биективно (в PTQ g(A/B) = g(A//B)).
11
Интерпретация (3)
Тогда интерпретация f :
• отображает базовые выражения некоторой синтаксическойкатегории в денотаты соответствующего ей типа приотображении g :
• если α - типа γ, то [[α]] = f (α) ∈ g(γ)• природа денотатов не уточняется
• сопоставляет структурым операциям операциисемантической композиции:
• f (Fγ(α1 : τ1, α2 : τ2, ..., αn : τn) : ε =f (Fγ)(f (α1) : g(τ1), f (α2) : g(τ2), ..., f (αn) : g(τn)) : g(ε)
12
Интерпретация (4)
Замечания:
• мы контролируем отображение g и можем сделать еготаким, как нам нужно;
• построенная алгебра содержит много лишнего, насинтересуют только “корректно типизированные”фрагменты;
• структурные операции могут определяться как схемыаксиом, т. е. множество синтаксических правил не обязанобыть конечным.
13
Интерпретация (5)
• Множество возможных денотатов E и функцияозначивания f образуют модель <E , f >
• Индексы: множество возможных миров I и множествомоментов времени J.
• Множество J снабжается структурой линейного порядка.• Пара (i , j) ∈ I × J обозначает точку отнесенности (point ofreference)
• Модальные операторы �, H, W
14
Спасибо!