Ограничения или преимущества
Следуя [1] можно выделить три подхода к построению систем естественно-языкового общения (ЕЯ-общения), которые отличаются друг от друга, в первую очередь, подходами к построению лингвистической составляющей.
1) Лингвистический. Изучается сам язык, без ограничений, порой без нацеленности на автоматизацию. Используются, в основном, такие формальные средства как различные грамматики Хомского.
2) Экспериментальный. Используются ограничения проблемной области для выделения определенного подмножества естественного языка (ЕЯ), для которого на некоторых эвристических критериях и методах (семантические падежи, концептуальные зависимости и т.п.) строится модель.
3) Прагматический. Конкретные системы для решения конкретных задач в узкой проблемной области с ограниченным языковым интерфейсом, разработанные по принципу достаточности.
Данная работа, является логическим продолжением [2], где мы, не претендуя на полное решение первичной задачи понимания ЕЯ, начинали с использования принципа достаточности прагматического подхода - т.е. использовали минимальные средства для решения узкой задачи понимания отдельного предложения (фразы) ЕЯ. Для решения таких задач предлагалось использовать предикатно-актантную модель предложения, предложенную в [3], и которая схожа с моделью концептуальных зависимостей Р.Шенка [7], а также с рядом других работ (Ч.Филлмор, П.Уинстон, Д.Апресян).
Теперь мы предлагаем совместить эту достаточно проработанную модель с преимуществами интерактивного режима и некоторыми возможностями для обучения. Такое объединение ведет к перспективе выхода за рамки чисто прагматичного подхода по направлению к проблемам семантики текстов ЕЯ, и, т.о., мы сдвигаемся в направлении экспериментального подхода.
Ограничения или преимущества прагматического подхода
Одним из основных принципов прагматического подхода является, видимо, принцип достаточности. Этот принцип предполагает использование необходимого и достаточного объема методов и средств, для решения поставленной перед системой задачи. Этот минимальный набор определяется путем анализа особенностей всех участников ЕЯ-общения и выделением для каждого определенного набора характерных черт позволяющих без особых проблем сузить, ограничить размеры решаемых проблем.
С точки зрения чистого прагматического подхода мы можем не только учитывать существующие, естественные ограничения, помогающие нам решать поставленную задачу, но и вносить собственные ограничения, если они рациональны и не мешают участникам ЕЯ-общения.
За основу списка участников ЕЯ-общения возьмем элементы круговой цепочки «проблемная область – пользователь – текст ЕЯ – система – реакция системы — проблемная область». Несмотря на то, что такая цепочка является лишь упрощенной схемой, рассмотрим теперь каждого из участников ЕЯ-общения с точки зрения его влияния на процедуру анализа текста ЕЯ.
Проблемная область. В первую очередь здесь мы должны определить сферу возможного применения нашей методики. Наиболее очевидным кажется ее использование в системах, анализирующих некоторые описания действий или описания объектов. В таких системах наиболее четко проявятся преимущества предикатно-актантной модели ЕЯ, которая взята нами за основу. Примерами сфер возможного применения могут служить [3], где рассмотрена система автоматизации построения проектных спецификаций на основе фраз ограниченного ЕЯ, или проблема анализа естественно-языковых ответов в системах тестирования [2], запросно-ответные системы и т.п.
В соответствии с прагматическим подходом, нашей задачей является не построение некоторого семантического представления, которое позволяет «понять» смысл входного текста ЕЯ, а в построении некоторой концептуальной модели элементарной сцены, описывающей действие, позволяющей системе адекватно ответить на запрос пользователя.
Пользователь. Первоначально необходимо констатировать факт наличия нескольких категорий пользователей, которые различаются по степени подготовленности – начиная от «чайника» и заканчивая администратором системы. Здесь прагматический подход позволяет нам просто готовиться к худшему, т.е. вообще пока не рассматривать проблемы общения администратора с системой.
Категория пользователя-человека, как носителя ЕЯ, является для нас, пожалуй, самой критической с точки зрения влияния на процедуру анализа того текста, который пользователь передает системе. Это связано с тем, что субъективные, личностные, образовательные и иные особенности человека существенно влияют на вид тех конструкций ЕЯ, которые он формирует как описание некоторого действия.
В процессе эксплуатации экспериментальных и промышленных систем человеко-машинного общения выяснилось, что не менее 25 % высказываний человека-пользователя просто неправильно строятся с точки зрения грамматики или семантики [4]. При этом следует учесть, что данная статистика далеко не всегда собиралась с категорий неподготовленных пользователей. Кроме этого, имеется целый ряд других особенностей ЕЯ, к которым, прежде всего, относятся: неточные высказывания, грамматические ошибки и описки, разнообразные сокращения, неправильная или слишком сложная структура текста, фрагменты жаргонов или элементы специализированных языков и т.п., которые также приводят к коммуникативным неудачам.
Текст ЕЯ. Под текстом ЕЯ мы понимаем ту информацию, которая передается пользователем в систему как описание некоторого действия. Укажем на существенные отличия между выражениями «ограниченный ЕЯ — текст » и «текст ограниченного ЕЯ». Последнее означает, что мы искусственно заставляем пользователя системы использовать ограниченное подмножество терминов и конструкций языка при общении с системой. В таком случае наложение ограничений на ЕЯ кажется нелогичным, поскольку, наверное, легче обязать пользователя выучить несколько строго формальных конструкций некоторого входного языка системы.
Выражение «ограниченный ЕЯ текст» означает, что мы не пытаемся накладывать никаких ограничений на форму ответа, а его объем просто ограничен некими разумными пределами.
Реакция системы. Поскольку проблема вербализации, не является предметом нашего рассмотрения, то будем считать, что реакцией нашей системы будет построение некоторого формального представления того действия, которое описывает ограниченный текст ЕЯ.
Т.о. далее речь пойдет об анализе некоторого фрагмента текста ЕЯ, описывающего некоторое элементарное действие или факт. При этом текст, как отмечено выше, может с достаточно большой вероятностью содержать в себе причину коммуникационной неудачи. При этом целью анализа является построение некоторого формального представления структуры этого действия или описания объекта.
Анализ текста и некоторые возможности диалогового взаимодействия
Первоначально, отметим, что, при проведении анализа не учитываются синтаксические и морфологические признаки, поскольку предполагается, что анализируемый текст, представляет собой описания, в основном, корневых морфем, имен существительных, или лексем, выступающих в роли имен.
Процедура анализа основана на следующих подходах.
Во-первых, существует ряд элементарных действий и элементарных объектов, для которых возможно полностью, или почти полностью, автоматическое построение предикатно-актантного представления структуры действия. Анализ этих элементарных действий строится на основе ожиданий или контекста, который обновляется в каждой точке анализа.
Во-вторых, поскольку как отмечено выше, текст ЕЯ, который является входным для системы, с вероятностью не менее 25% уже содержит в себе причину коммуникативной неудачи, то для ее разрешения необходимо организовать диалоговый режим работы системы. Как будет показано ниже, интерактивный режим предполагается использовать и для целей обучения системы.
Сама идеология и процедура подобного анализа рассмотрена в [3]. Например, анализ фразы «к 123 прибавить 321» очевиден: в первую очередь определяется предикат («прибавить»), и, если эта словоформа соответствует допустимому выражению для обозначения некоторой элементарной операции, то контекст анализа поменяется. Теперь мы ожидаем (ищем) два актанта этого действия (в нашем случае 123 и 321). Очевидно, что эти ожидаемые объекты должны быть элементарными – то есть допустимыми для данного действия.
Рассматривая совокупность шаблонов элементарных действий для некоторой проблемной области и процедуру их использования, можно констатировать тот факт, что эта совокупность моделируется некоторой древообразной структурой, уровень которой напрямую зависит от количества уровней в используемой классификации предикатов и объектов. Например, приведем фрагмент классификации, которая предполагает, что мы анализируем тексты, являющиеся описаниями арифметических операций.
1. Арифметические операции
1.1 Операция сложения 1.2 Операция вычитания
1.1.1.Операции сложения 2-х чисел 1.2.1 Операция вычитания 2-х чисел
Данная классификация предполагает, что имеется два вида элементарных действий (сложение и вычитание) и один тип элементарных объектов (число). Т.о. шаблоны элементарных действий у нас выглядят как «число+число» и «число-число».
В режиме диалога мы, в первую очередь, можем решать задачи обучения, т.е. связывать с шаблоном элементарного действия «число+число», различные варианты его записи («суммировать 123 и 321», «123+321» и т.п.). Во вторых, мы можем таким образом устранить такие причины коммуникационных неудач как неточности, описки и т.п.
Для анализа ограниченного текста ЕЯ, описывающего элементарное действие, для которого в базе системы имеется описание шаблона этого действия, подобный подход, кажется, вполне достаточен.
Далее отметим лишь некоторые дополнительные возможности по расширению возможностей предложенного выше метода, которые последуют из принципа ее обучаемости.
Шаблон может быть видоизменен путем добавления листа в дерево классификации. Например, шаблон «число+число» целесообразно записать в виде «объект+объект» и тогда операция арифметического сложения станет только одним из многих возможных вариантов конкретной формы записи этого шаблона. В рамках некоторой ограниченной проблемной области, очевидно, мы сможем, не изменяя идеологии нашего подхода, просто расширять число и типаж объектов этой операции. Например, добавив в наш пример классификации строку «1.1.2. Операция увеличения всех элементов вектора на число» мы получаем новые варианты шаблонов: «вектор+число» или «столбец таблицы+число». В дерево классификации может быть добавлена целая ветвь, например, соответствующая новому типу операций — «отношения сравнения».
Однако при расширении проблемной области такой подход приведет первоначально к избыточности и сложности в процессе анализа, а затем к необходимости проведения классификации предикатов и их объектов, с использованием более сложных моделей, чем древовидные. Ситуация достаточно типична для многих представителей экспериментального подхода. Сценарии Шенка фактически являются формализованной (классифицированной) информацией о различных стереотипных эпизодах [7]. В более поздних работах [5,6] также рассматриваются различные системы классификации отношений между понятиями, однако ни одна из этих систем не является полной и применяется лишь для фиксированных ситуаций. Таким образом, вопросы выделения этих отношений, их классификация и выбор методик их моделирования до сих пор актуальны.
800x600 П.А.Косенко
|