Р.БЕРТОН СЕМАНТИЧЕСКАЯ ГРАММАТИКА
СОДЕРЖАНИЕ
1 Введение
а) отличительные особенности семантических грамматик
б) стандартные грамматики и семантические грамматики
2 Преимущества семантических грамматик
а) эффективность
б) удобство
в) учет особенностей речи
г) обработка ошибок ввода
д) самообъяснение
3 Ограничения, накладываемые на семантические грамматики
а) исключение сложных форм
б) необходимость различных видов категорий для различных пред-
метных областей
1 Так называемая "семантическая грамматика" - это грамматика, в
которой категории обозначают как семантические, так и синтаксические
понятия. Впервые она была разработана в начале 1970-х годов при создании
интерфейсов на естественном языке для программы-оболочки SOPHIE и баз
данных LIFER и PLANES. Ее продолжали использовать в различных коммер-
ческих и других приложениях, таких как ROBOT (известный также как IN-
TELLECT), PHRAN, XCALIBUR и CLOUT. Отличительная черта семантической
грамматики - тип кодируемой информации, а не формализм для ее предс-
тавления. В семантических грамматиках использовались различные форма-
лизмы, включая расширенные сети перехода и расширенные грамматики не-
посредственных составляющих. В отличие от систем на естественном языке
в общем, цель семантических грамматик - описать раздел естественного
языка для свободного взаимодействия пользователя с системой. В таком
виде семантическая грамматика - прежде всего инструмент в области ин-
женерии естественного языка (хотя некоторые исследователи предлагают
считать семантические грамматики психологической теорией языкового по-
нимания).
Пониманию семантических грамматик способствуют знания о теориях
естественного языка. Цель этих теорий - объяснить закономерности языка.
Примером может служить трансформационная грамматика. Синтаксическая
часть теории объясняет структурные закономерности языка, например, по-
рядок слов. Эти правила называются грамматикой.
Пример пассивных отношений в английском языке:
1 The boy hit the ball.
2 The ball was hit by the boy.
<Noun Phrase 1><Verb><Noun Phrase 2>:=
<Noun Phrase 2><Auxiliary Verb><Verb>by<Noun Phrase 1>
В семантических грамматиках выбор категорий базируется на семантике
знаний о мире и сферах приложения, а также на закономерностях языка. Таким
образом, категории системы SOPHIE, разработанной для ответов на вопросы поль-
зователя об электрических цепях, могут включать measurement, measurable quan-
tity, part наряду со стандартными категориями determiner, preposition. Напри-
мер, правило <Measurement>:=<Determiner><Measuable-Quantity><Preposition><Part>
применимо к следующим предложениям:
The voltage across R9.
The current through the voltage reference capacitor.
The power dissipation of the current-limiting transistor.
- 3 -
S
/ \
NP VP
і / \
і / \
і / \
Q/PRO V NP
і і / / \
і і DET N PP
і і і і / \
і і і і PREP N
і і і і і і
What is the voltage across R9
Стандартная структура английского вопроса
QUERY
/ \
QUESTION MEASUREMENT
INTRO
і \ / / \ \
QUESTION і
WORD і DET MEASURABLE PREP PART
і і і QUANTITY і і
і і і і і і
What is the voltage across R9
Структура вопроса в семантической грамматике
- 4 -
2 Семантические грамматики обеспечивают решение многих проблем,
возникающих при построении естественно-языковых интерфейсов. Про-
блемы включают в себя:
а) эффективность
б) удобство
в) учет особенностей речи
г) ошибки ввода
д) самообъяснение.
а) Семантические грамматики эффективны, так как они допускают
использование семантических отношений для сокращения количества аль-
тернативных парсингов, которые должны учитываться. Эффективность так-
же повышается за счет того, что семантическая интерпретация (значение)
выражения выводится непосредственно из грамматических правил.
Обычно в семантической грамматике каждому правилу соответствует
расширение, связанное с ним, которое строит общую интерпретацию из ин-
терпретаций составляющих. Например, интерпретацией правила
<Query>:=<Question-Intro><Measurement> является запрос к базе данных,
который ищет измерение, определенное в интерпретации <Measurement>.
Интерпретация <Measurement> уточняет количество, которое измеряется,
и где оно будет измеряться. Прямая связь семантической интерпретации с
грамматикой дает возможность избежать отдельного процесса семанти-
ческой интерпретации.
б) Создание в обозримом будущем естественно-языкового интерфейса,
понимающего весь язык, нереально. Хороший интерфейс обеспечивает обще-
ние на определенном подъязыке. Наличие такой возможности называется
удобством.
Удобная система принимает незначительные незначительные или
местные варианты вводимой информации. Например, система, которая при-
нимает вопрос "Is something wrong?" и не принимает "Is anything wrong?"
не удобна. Любой подъязык, который не обеспечивает высокого уровня
удобства, хуже, чем отсутствие возможности естественно-языкового обще-
ния вообще, так как пользователю придется постоянно изменять введенную
информацию.
в) Разработку удобных интерфейсов осложняет существование проно-
минальной и анафорической референции и эллипсиса.
Пример эллипсиса (4):
(3) What is the population of Los Angelos?
(4) What about San Diego?
- 5 -
Системы, использующие семантические грамматики, распознают "San
Diego" как значение параметра <City>. Самое последнее употребление
располагается в предыдущем вводе информации, и новое предложение заме-
няется старым. В системах SOPHIE, PLANES, XCALIBUR операция произво-
дится с использованием интерпретационной структуры предыдущих вводов
информации, а в системе PHRAN замена происходит в предыдущей строке,
которая затем подвергается повторному анализу.
Семантические грамматики могут также обрабатывать прономинальную
и анафорическую референцию, как, например, в предложении "What is it
for San Francisco?"
г) Естественно-языковой интерфейс должен обрабатывать предложения
вне его грамматики, т.е. предложения не поддающиеся анализу. Решением
проблемы является частичное понимание предложения, когда или игнориру-
ются непонятные слова ("fuzzy parsing"), или распознаются словосочета-
ния, удовлетворяющие грамматике. С пользователем постоянно поддержи-
вается обратная связь.
д) Относительной сложностью в разработке естественно-языковых ин-
терфейсов является объяснение возможностей системы. Для помощи пользо-
вателю используется информация, содержащаяся в грамматике. Пример диа-
лога в LIFER:
USER: What is the voltage <help>
SYSTEM RESPONSE: Inputs that would complete the <measement> rule
are:
across <part>
between <node> and <node>
at <node>
В системе NLMENU пользователю предлагается меню из правильных
предложений.
3 Семантические грамматики не обрабатывают сложные формы союзов,
сравнительных степеней и предложения с вставленными частями, как, нап-
ример: "Which ships does the admiral think the forth fleet can spare?"
Более того, для каждой предметной области нужно создавать отдельную
грамматику, что очень неудобно.
Решением проблемы может служить переформулирование категорий,
чтобы сделать их более синтаксическими. Другим путем является внесение
изменений не в сами грамматики, а в прикладные программы (см. систему
PHRAN).