Чтение онлайн

ЖАНРЫ

Компьютерная лингвистика для всех - Мифы, Алгоритмы, Язык
Шрифт:

* 7. ЯЗЫК

Человек был фигурой между двумя способами бытия языка; или, точнее, он возник в то время, когда язык после своего заключения внутрь представления как бы растворился в нем, освободился из него ценой собственного раздробления: человек построил свой образ в промежутках между фрагментами языка.

М. Фуко. Слова и вещи

РЕКУРСИЯ В СЮЖЕТЕ

Сюжетные построения классических мифов и сказок ограничены. Эти схемы давно перенесены в современную жизнь, тысячи раз повторены. Уже никого не удивишь современными Гамлетом или Дон Кихотом. Но все же литература развивается, появляются все новые и новые формы, и процессу этому не видно конца. Что дает возможность создавать все новые и новые сюжетные схемы? Здесь прослеживается полная аналогия с алгоритмами. При помощи простых ограниченных алгоритмических средств из конечного набора базовых функций можно построить бесконечное многообразие сложных алгоритмов. Наиболее важная алгоритмическая операция - рекурсия. Именно она, заданная тем или иным способом, создает полный бесконечный класс алгоритмов. В литературе, описывающей сложные жизненные процессы, рекурсия явно стала определяться только начиная с XVII в. Она возникает, когда в алгоритмическом развитии событий, описанных в литературном произведении, начинает повторяться схема, возможно с другим конкретным наполнением и, следовательно, с возможными, порой значительными отклонениями от первоначальной линии развития. Схема маскируется, но узнается. С позиций алгоритмического подхода рекурсия трактуется как вызов в определенной ситуации процедурной схемы самой себя как подпроцедуру. Для обнаружения алгоритмических схем необходимо подниматься на более высокий уровень абстрактного рассмотрения текста, забывая конкретные имена, обстановку, особенности объектов и выявляя общие алгоритмические линии развития процессов, составляющих литературное произведение. Алгоритмическая аналогия - литературное произведение рассматривается как процедура (процесс) с заданными константами и переменными. При

вызовах этой процедуры константы остаются без изменений, а значения переменных в момент вызова определяют течение вызванного процесса. Книга, описывающая литературное произведение, может рассматриваться как главный процесс, содержащий в себе все остальные. Одно из первых проявлений рекурсии в литературе связано с введением в текст повествования книги самой этой книги. Главный процесс как элемент использует сам себя. Если при этом описывается текст этой книги, то она не может быть никогда закончена. Моменты перехода от книги к ее вложенной копии должны повторяться до бесконечности. Поэтому, чтобы процесс все-таки сходился, либо нужно вводить ограничение - в книге вызывается только ее часть, либо в момент окончания чтения, книги все должно исчезнуть. Мышление человека рекурсивно. Поэтому первое узнавание рекурсии сопровождалось эмоциональным всплеском. Разум узнавал сам себя. На картинах Веласкеса, Ван Эйка, Петруса Христуса и Мемлинга в зеркалах впервые отразилась рекурсивная реальность. Первым европейским романом, удивившим читателей приемом рекурсии (не в этом ли слава романа!), был роман отставного испанского солдата, "таланта-самоучки" Мигеля де Сервантеса "Дон Кихот". Сервантес все время пытался смешивать два мира: мир читателя и мир книги. У Сервантеса главный процесс не просто книга, но книга плюс читатель. В шестой главе цирюльник, осматривая библиотеку Дон Кихота, находит книгу Сервантеса и высказывает суждения о писателе. Вымысел Сервантеса рассуждает о нем. В начале девятой главы сообщается, что роман переведен с арабского и что Сервантес купил его на рынке. Наконец, во второй части романа персонажи уже прочли первую часть. Многие исследователи отмечали этот прием у Сервантеса как поворотный момент в литературе. Об этом пишет Х. Л. Борхес в рассказе "Скрытая магия Дон Кихота", это же отмечает М. Фуко в книге "Слова и вещи",

"Дон Кихот" рисует нам мир Возрождения в виде негативного отпечатка: письмо перестало быть прозой мира; сходства и знаки расторгли свой прежний союз; подобия обманчивы и оборачиваются видениями и бредом; вещи упрямо пребывают в их ироническом тождестве с собой, перестав быть тем, чем они являются на самом деле; слова блуждают наудачу, без своего содержания, без сходства, которое могло бы их наполнить; они не обозначают больше вещей; они спят в пыли между страницами книг. Магия, дававшая возможность разгадки мира, открывая сходства, скрытые под знаками, служит теперь лишь для лишенного смысла объяснения того, почему все аналогии всегда несостоятельны. Эрудиция, прочитывавшая природу и книги как единый текст, возвращается к своим химерам: ценность знаков языка, размещенных на пожелтевших страницах фолиантов, сводится лишь к жалкой фикции того, что они представляют. Письмена и вещи больше не сходствуют между собой. Дон Кихот блуждает среди них наугад. Тем не менее язык не полностью утратил свое могущество. Отныне он обладает новыми возможностями воздействия. Во второй части романа Дон Кихот встречается с героями, читавшими первый том текста и признающими его, реально существовавшего человека, как героя этой книги. Текст Сервантеса замыкается на самом себе, углубляется в себе и становится для себя предметом собственного повествования. Первая часть приключений играет во второй части ту роль, которая вначале выпадала на долю рыцарских романов. Дон Кихот должен быть верным той книге, в которую он и в самом деле превратился; он должен защищать ее от искажений, подделок, апокрифических продолжений; он должен вставлять опущенные подробности, гарантировать ее истинность. Но сам Дон Кихот этой книги не читал, да и не стал бы читать, так как он сам - эта книга во плоти. Он так усердно читал книги, что стал было знаком, странствующим в мире, который его не узнавал; и вот вопреки своей воле, неведомо для себя он превратился в книгу, хранящую свою истинность, скрупулезно фиксируюшую все, что он делал, говорил, видел и думал,- в книгу, которая в конце концов приводит к тому, что он узнан, настолько он похож на все те знаки, неизгладимый след которых он оставил за собой. Между первой и второй частями романа, на стыке этих двух томов и лишь благодаря им Дон Кихот обрел свою реальность, которой он обязан только языку, реальность, остающуюся всецело а пределах слов. Истинность Дон Кихота не в отношении слов к миру, а в той тонкой и постоянной связи, которую словесные предметы плетут между собой. Несостоятельная иллюзия эпопей стала возможностью языка выражать представления. Слова замкнулись на своей знаковой природе (101). Элементы использования рекурсии находим еще раньше у Шекспира. Гамлет ставит спектакль, где в упрощенном варианте описываются события трагедии "Гамлет", написанной в период около 1600 г. Прием "книга в книге" встречается в сказках "Тысяча и одна ночь". В одну из магических ночей царь слышит свою же историю со всеми сказками и ночами. В поэме Вальмики "Рамаяна" дети Рамы в лесу учатся у самого Вальмики по книге "Рамаяна". Древнеиндийская наблюдательная философия одной из первых обратила внимание на рекурсивное развитие природы. Все определения Брахмана - верховного божества - суть рекурсивные определения, в которых понятие выражается через себя же. Такие определения имеют смысл только в алгоритмическом плане - определяемое понятие вызывает и бесконечно разворачивает свое же определение. "Кем Брахман не понят, тем понят, кем понят, тот не знает его. Он не распознан распознавшими, распознан нераспознавшими" (Кена упанишада). "Я - время года, я - происходящий от времени года, рожденный от пространства своего источника..." (Каушитаки упанишада). "Нет ничего выше, ничего меньше его того, который выше высокого, огромней огромного" (Маханараяна упанишада). Впрочем, и в христианстве при определении бытия используются рекурсивные определения. "В начале было Слово, и Слово было у Бога, и Слово было Бог" (От Иоанна святое благовествование, Новый завет). "Мастер и Маргарита" один из наиболее ярких рекурсивных романов. Развивается одна алгоритмическая схема, используемая в разных процессах: Мастер и Маргарита, Иешуа и Пилат, Воланд и компания. Тема Иешуа и Пилата рекурсивно вызывается из темы Мастера и Маргариты (102). Кроме того, здесь также используется прием "книга в книге". Мастер пишет роман об Иешуа и Пилате, текст которого сливается с текстом книги "Мастер и Маргарита".

=====================================================

(101) Фуко М. Слова и вещи.- С. 96 - 97.

(102) Анализ рекурсивного строения зтого произведения сделан в кн.: Анисимов А. В. Информатика. Творчество. Рекурсия.- С. 136 - 151,

=====================================================

Наиболее яркий современный рекурсивный роман, удостоенный Нобелевской премии в области литературы, - "Сто лет одиночества" Г. Маркеса. Рекурсивно повторяются события поколений семейства Буэндиа. Последний из рода Буэндиа заканчивает расшифровывать рукопись волшебника Мелькиадеса, которая оказывается тем же описанием "Ста лет одиночества". По мере прочтения поднимается и нарастает ураган. Прочитывается последняя страница, книга заканчивается, и все исчезает в бушующем смерче. В "Защите Лужина" В. Набокова герой с удивлением узнает пласты рекурсивного повторения реальности, преследующей его. В романе "Время и место" Ю. Трифонова писатель создает роман о писателе, пишущем роман о писателе, который что-то тоже пишет о писателе. О рекурсивных снах Н. В. Гоголя, М. Ю. Лермонтова и Ф. М. Достоевского мы уже говорили. Из сказанного можно сделать вывод, что литература в своем моделировании мира все ближе и ближе подходит к алгоритмической технике. В последнее время наиболее явно проявляется тяготение литературы к использованию рекурсии. Многие авторы интуитивно применяли этот прием как отражение реального развития мира. И это было признано читателями. Теперь, когда рекурсия узнана, возможно сознательное применение сложных рекурсивных конструкций, хорошо известных в теории алгоритмов и программировании. Например, возможно определение рекурсивного порождения процесса, в создании которого участвуют одновременно несколько процессов (смешение отражений разных зеркал, снов и реальности) (103). Это малоисследованная область даже в теории алгоритмов. Это интеллектуальные игры недалекого будущего. Некоторое (все же слабое) представление об этом может дать "Сон китайского императора". В этом фрагменте рекурсия все-таки слабо зависит от процессов.

МОДЕЛЬ МИРА

Компьютеры вошли в жизнь человека - он все больше и больше полагается на них. Компьютеры печатают документы, управляют сложными технологическими процессами, проектируют технические объекты,

=====================================================

(103) См.: Анисимов А. В. Рекурсивные преобразователи информации //Дискретная математика - 1989.- Э 3.- С. 3 - 18.

=====================================================

развлекают детей и взрослых. Естественно стремение человека как можно полнее выразить себя в алгоритмических устройствах, преодолеть языковый барьер, разделявший два разных мира. Как уже неоднократно отмечалось, язык, человек и реальность неразрывно связаны между собой. Поэтому обучение компьютера естественному языку - задача чрезвычайно сложная, связанная с глубоким проникновением в законы мышления и языка. Научить компьютер понимать естественный язык - это то же, что научить его чувствовать мир. Многие ученые считают решение этой задачи принципиально невозможным. Но так или иначе процесс сближения человека и его

электронного детища начался, и кто знает, чем он закончится. Во всяком случае, человек, пытаясь моделировать задачу языкового общения, начинает понимать себя гораздо полнее. Существуют отдельные программы, имитирующие генерацию осмысленного текста. Например, программа Mark Chainy, созданная американскими программистами Б. Эллисом и Д. Митчелом, анализирует заданный текст и для каждой пары соседних слов вычисляет вероятность появления третьего слова, если эта пара уже появилась. Затем, используя зти вероятности и датчик псевдослучайных чисел для "случайного" выбора символов, генерируют сам текст. Название программы отражает связь с цепями Маркова. Такие игры с вероятностью порождают интересные тексты, напоминающие речь шизофреника, и иногда сбивают с толку компьютерных собеседников. Прочитав учебник по математике, программа может сказать: "Зачем они начали отсчитывать четвертями. Огромная бутыль, вмещающая четыре четверти - это уже трехзначное число..." Эллис подключил свою программу к многопользовательской сети ЭВМ. Программа обрабатывала имеющиеся в сети сообщения и выдавала сумбурные тексты. Некоторые пользователи требовали убрать программу с ее чудовищным бредом, другие чувствовали в ней родственную душу, и им нравилась подобная болтовня. Такие попытки нельзя использовать для серьезных научных разработок - нет и намека на понимание языка. Правильный подход должен начинаться с моделирования мира. Любое языковое сообщение проявляет двойственную сущность. С одной стороны, это отражение фрагмента реальности с одновременными изменениями и взаимодействиями многих величин. С другой текст разворачивается в виде последовательной линейной цепочки символов, задающей запись текста и его восприятие.

"Если бы ум был способен выражать идеи так, "как он их воспринимает", то, без всякого сомнения, он "выражал бы их все сразу". Но это совершенно невозможно, так как если "мысль - простое действие", то "ее высказывание последовательное действие". этом состоит специфика языка, отличающая его и от представления (представлением которого он, однако, в свою очередь является), и от знаков (к которым он принадлежит на равных правах). Язык не противостоит мышлению как внешнее - внутреннему, или как экспрессия рефлексии. Он не противостоит другим знакам - жестам, пантомимам, переводам, изображениям, эмблемам, как произвольное или коллективное - естественному или единичному. Но он противостоит им всем как последовательное одновременному. По отношению к мышлению и знакам он то же самое, что и алгебра по отношению к геометрии: одновременное сравнение частей (или величин) он заменяет таким порядком, степени которого должны быть пройдены последовательно, одна за другой. Именно в этом строгом смысле язык оказывается анализом мысли: не простым расчленением, но основополагающим утверждением порядка в пространстве" (104).

Таким образом, в представлении разума текст возникает как динамический параллельный процесс, определяющий активности и взаимодействия одновременных алгоритмических структур, и выражается интерпретацией такого представления в виде линейной последовательности символов. Для того чтобы уметь автоматически генерировать тексты, необходимо прежде всего описать взаимодействующую модель мира, затем научиться строить последовательную интерпретацию модели на уровнях отдельных фрагментов и предложений (рис. 14). Язык появился как особое отражение параллельной реальности. Компьютеры исторически возникали в обратном порядке. Сначала осваивались последовательные ЭВМ, затем начался активный переход к параллельным вычислительным комплексам. Поэтому программисты сначала обжились в мире последовательных языков программирования, а сейчас перешли к параллельным языкам. В любом литературном произведении выделяются герои, объединяемые между собой сильными ассоциативными связями. Например, в романе Л. Н. Толстого "Анна Каренина" Анна связана с Вронским, Кити с

=====================================================

(104) Фуко М. Слова и вещи.
– С. 136-137.

=====================================================

* Рис. 14. Модель языка

Левиным, в "Мастере и Маргарите" М. А. Булгакова Мастер связан с Маргаритой, Иешуа с Пилатом, Воланд со своей темной веселой компанией. Такое неразрывное объединение объектов в одну действующую стрктурную единицу в программировании называется процедурой или процессом. В случае параллельного программирования, когда разрешаются одновременные действия разных объектов, обычно говорят о процессах. Так как литературное произведение описывает фрагмент реальности с возможными одновременными событиями, то, следуя устоявшейся в программировании традиции, мы тоже будем рассматривать в литературных текстах процессы. Итак, Анна Каренина и Вронский, Кити и Левин, Мастер и Маргарита, Иешуа и Пилат, Воланд и компания представляют собой отдельные замкнутые главные процессы. Процессы взаимодействуют между собой, изменяя значения собственных параметров. В свою очередь, каждая единица такого процесса также может содержать подчиненные взаимодействующие процессы. Так, у Маргариты есть домработница Наташа, тоже участвующая в событиях, у Пилата - воины, начальник тайной службы, Иешуа имеет ученика Левия Матвея и оказался в одной компании с двумя разбойниками. Все они могут в определенной степени существовать и действовать самостоятельно. Неделимый элементарный процесс - это структурная единица текста с элементами собственного независмого развития, но уже без таковых подчиненных объектов. Нос майора Ковалева из повести Н. В. Гоголя образует главный процесс, нос Буратино - просто константа, входящая в процесс Буратино. Состояния героев внутри процессов описываются глобальными и локальными переменными. Значения глобальных переменных известных другим процессам, могут изменяться в моменты взаимодействия процессов, значения локальных изменяются только внутри процесса, которому они принадлежат. В настоящее время программисты заняты активными поисками выразительных, удобных языковых средств для описания параллельных взаимодействующих процессов. Такие языки уже существуют и реализованы на параллельных ЭВМ. В США по заказу министерства обороны разработан язык АДА, по-видимому, сдающий свои позиции, в Европе доминирует язык ОККАМ, созданный английской фирмой INMOS для транспьютерных систем. ОККАМУ, кажется, сопутствует звезда удачи. Автор этой книги участвует в разработке ПАРУС-технологии программирования (ПАРУС расшифровывается как Параллельные Асинхронные Рекурсивные Управляемые Системы). ПАРУС-системы программирования дают возможность расширять любые языки развитыми средствами параллельного взаимодействия и рекурсивного подчинения объектов друг другу. ПАРУС удачно описывает процессы лингвистической обработки информации. ОККАМ вписывается в ПАРУС как частный, но реализованный практически на транспьютерах случай. Анализ литературных текстов с позиций алгоритмических процессов позволяет выявить закономерности и приемы, применяемые разными авторами при построении литературных форм. С другой стороны - и это то, к чему мы стремимся, создавая параллельные программы, генерирующие текст, и пропуская их через последовательную моделирующую программу, - можно надеяться на создание автоматических генераторов текстов.

ДИАЛОГИ

Взаимодействия литературных текстовых процессов обычно описываются диалогом. Происходит информационный обмен, иногда передаются объекты из разных процессов.

" - Я, игемон, никого не призывал к подобным действиям, повторяю. Разве я похож на слабоумного?
– О да, ты не похож на слабоумного,- тихо ответил прокуратор и улыбнулся какой-то страшной улыбкой, - так поклянись, что этого не было.
– Чем хочешь ты, чтобы я поклялся?
– спросил, очень оживившись, развязанный.
– Ну, хотя бы жизнью твоею,- ответил прокуратор,- ею клясться самое время, так как она висит на волоске, знай это!
– Не думаешь ли ты, что ты ее подвесил, игемон?
– спросил арестант.- Если это так, ты очень ошибаешься. Пилат вздрогнул и ответил сквозь зубы: - Я могу перерезать этот волосок.
– И в этом ты ошибаешься,- светло улыбаясь и заслоняясь рукой от солнца, возразил арестант,- согласись, что перерезать волосок уж наверно может лишь тот, кто подвесил?" (105). Передаются объекты-слова из одного процесса в другой и возбуждают ассоциативные связи в семантической сети каждого процесса. Даже явно повторяются ключевые слова при каждом обмене. Как бы выполняется подтверждение принятия ключевой информации. Иногда при диалогическом обмене управляющий процесс может получать информацию о состояниях другого процесса, изменять ее и возвращать с новыми значениями.

"И тут прокуратор подумал: "О, боги мои! Я спрашиваю его о чем-то ненужном на суде... Мой ум не служит мне больше..." И опять померещилась ему чаша с темной жидкостью. "Яду мне, яду!" И вновь он услышал голос: - Истина прежде всего в том, что у тебя болит голова, и болит так сильно, что ты малодушно помышляешь о смерти. Ты не только не в силах говорить со мной, но тебе трудно даже глядеть на меня. И сейчас я невольно являюсь твоим палачом, что меня огорчает. Ты не можешь даже и думать о чем-нибудь и мечтаешь только о том, чтобы пришла твоя собака, единствен

=====================================================

(105) Булгаков М. А. Мастер и Маргарита,- М,: Современник, 1986.- С. 22.

=====================================================

ное, по-видимому, существо, к которому ты привязан. Но мучения твои сейчас кончатся, голова пройдет" (106).

Иешуа в процессе диалогического взаимодействия получил имя глобальной переменной из процесса Пилат, характеризующей физическое состояние прокуратора - головная боль. Иешуа изменил значение этой переменнои и передал его обратно в процесс Пилат. На языке взаимодействующих параллельных процессов это записывается так:

Процесс Иешуа ПРИНЯТЬ х из процесса Пилат; ГЕНЕРИРОВАТЬ текст приемки;

ИЗМЕНИТЬ х; ГЕНЕРИРОВАТЬ текст передачи; ПЕРЕДАТЬ х в процессе Пилат;

Процесс Пилат ГЕНЕРИРОВАТЬ текст передачи; ПЕРЕДАТЬ у в процесс Иешуа; ПРИНЯТЬ у из процесса Иешуа; ГЕНЕРИРОВАТЬ текст приемки;

Команды ПРИНЯТЬ и ПЕРЕДАТЬ - это парные команды, которые срабатывают одовременно, когда оба процесса приходят к выполнению этих команд; переменная х - принимающая переменная процесса Иешуа; у - переменная, характеризующая состояние прокуратора. Иешуа - управляющий процесс, так как он вносит изменения в процесс Пилат.

Поделиться с друзьями: