Введение в теоретическую лингвистику
Шрифт:
Возьмем в качестве примера следующее английское предложение: iwantapintofmilk 'Яхочу пинту молока'. (Оно напечатано без пробелов, чтобы указать, что в данный момент мы рассматриваем его просто как последовательность букв, каждая из которых изображает, как мы допустили, одну фонологическую единицу; конечно, в обычном произношении соответствующего устного высказывания пауз между словами нет.) Используя наше представление о допустимых последовательностях английских букв, мы можем попытаться заменять отдельные буквы и группы букв в разных местах нашего предложения. Мы знаем, например, что s может следовать за i и стоять перед а (ср. isangasongofsixpence 'Я спел песню шестипенсовика'); однако *isantapintofmilk не является приемлемым предложением. Здесь и в дальнейшем будем пользоваться звездочкой перед словом или предложением для обозначения их неприемлемости. В лингвистической практике такое применение данного символа получило широкое распространение. В историческом и сравнительном языкознании звездочка обычно обозначает незасвидетельствованное или «реконструированное» слово или фонологическую единицу (ср. § 1.3.13). Неприемлемы также *iwantapinkofrnilt или *ipindawantopfilk, хотя ни одно из этих высказываний не противоречит фонологической структуре английского языка. Даже если бы мы выявили на большом отрывке текста не только допустимые пары, тройки, четверки и т. д. букв, но также вероятности появления отдельных букв в соответствующем окружении (такие подсчеты были выполнены для английского и некоторых других языков, а результаты использовались для дешифровки и при разработке каналов связи для передачи письменных сообщений), это не помогло бы нам в наших попытках построить другие приемлемые английские предложения путем замены отдельных букв или групп букв в нашем предложении. Дело в том, что определенные «блоки» букв образуют в языке единицы «более высокого
Более существенным, нежели общая вероятность появления w после i и перед а, является тот факт, что w составляет часть «блока» want. С одной точки зрения блок можно рассматривать как допустимую для английского языка последовательность букв; с другой точки зрения его следует рассматривать как целостную единицу, которую могут заменять другие блоки букв, так, что при этом будут получаться приемлемые высказывания: idrinkapintofmilk 'Я пью пинту молока', itakeapintofmilk 'Я беру пинту молока' и т. п. При этом i 'я' также является «блоком»; то, что он состоит только из одной буквы, не существенно. На его место в данное окружение не может быть поставлена никакая другая отдельная буква так, чтобы получилось приемлемое высказывание, а только другие «блоки», например: 'we' мы, they 'они', thejoneses 'Джонсы' и т. п. То, что мы назвали «блоками», можно, по крайней мере в предварительном порядке, идентифицировать со словами языка. (Для упрощения мы не учитываем тот факт, что некоторые «блоки», которые могли бы заменить I в данном примере, являются не отдельными словами, а сочетаниями слов, например: The Joneses, They all 'они все' и т. п. Здесь читатель может вновь обратиться к разделу, в котором рассматривается «двойное членение» в плане выражения; см. §2.1.3).
4.2.6. ДИСТРИБУЦИОННЫЙ ПОДХОД К ГРАММАТИЧЕСКОМУ ОПИСАНИЮ
Заметим, что мы пришли к традиционной точке зрения, согласно которой английские предложения «структурируются» на двух уровнях: на уровне букв (или фонологических единиц) и на уровне слов, не прибегая явным образом к понятию значения. Мы только отделили фонологический (или орфографический) компонент приемлемости от приемлемости иного рода с тем, чтобы выделить внутри этого «остатка» различные компоненты приемлемости «более высокого уровня». Конечно, верно, что высказывания I want a pint of milk; I drink a pint of milk и т. д. (теперь мы можем ввести промежутки между словами) осмысленны в соответствующем контексте. Кроме того, они различаются по своему значению; это различие значений высказываний уместно описывать как функцию от значений составляющих их слов want, drink и т. д. Но пока мы не учитывали эти факты; и мы не будем этого делать в пределах представленной здесь теории грамматики. Эти факты подлежат рассмотрению в теории семантики. В принципе мы только построили множество приемлемых предложений, помещая разные слова в одну и ту же «раму», или контекст. Все множество контекстов, в которых может встречаться лингвистическая единица, составляет ее дистрибуцию (см. §2.3.1). Таким образом, здесь излагался дистрибуционный подход к грамматическому анализу.
Теперь мы можем констатировать, что фонология описывает приемлемость и неприемлемость высказываний в той мере, в какой это возможно, посредством правил или формул, устанавливающих допустимые сочетания фонологических единиц исследуемого языка, а описание приемлемости в терминах допустимых сочетаний слов на «более высоком» уровне как бы «переходит» к грамматике.
4.2.7. ВЗАИМОЗАВИСИМОСТЬ ФОНОЛОГИИ И ГРАММАТИКИ
На этой стадии изложения следует подчеркнуть, что мы все еще исходим из предположения, что предложения состоят из слов, а слова состоят из фонологических единиц (или букв, если мы имеем дело с письменным языком). Оба этих предположения ниже будут видоизменены. (Обоснование стало бы несколько более сложным, но не потеряло бы силы, если бы мы уточнили их и теперь.) Следует также упомянуть, что, хотя из нашего изложения могло сложиться впечатление, будто грамматическое описание, будучи независимым от фонологического анализа, все же непременно следует за ним, это не обязательно должно быть так (ср. § 3.3.16). Мы устанавливаем грамматику и фонологию как теоретически различные уровни лингвистической структуры. Но фонологическая и грамматическая структура конкретных языков обычно взаимосвязаны (различным образом и в различной степени). В задачу лингвиста, описывающего тот или иной язык, входит объяснение этой взаимосвязи — там, где она имеется (наряду с объяснением возможной взаимозависимости между грамматической и семантической структурой языка).
4.2.8. ПРОСТОЙ ПРИМЕР ДИСТРИБУЦИОННОГО АНАЛИЗА
Мы еще далеки от того, чтобы прийти к удовлетворительному представлению о лингвистическом описании. Мы еще не сказали, в частности, как определяются приемлемые сочетания слов. Перечисление списком всех приемлемых последовательностей слов совершенно невозможно, поскольку, как мы видели, ни один естественный язык нельзя рассматривать как ограниченное множество предложений. В случае замкнутого корпуса материала можно было бы, конечно, составить список всех фонологически (или орфографически) различных предложений и затем решать вопрос о приемлемости, справляясь в этом списке. Но это было бы малоинтересно в том смысле, что ничего не давало бы для нашего понимания способности носителя языка производить «новые» предложения; это не было бы к тому же и самым экономным способом описать данный текст. Если продолжить рассмотрение этого вопроса, мы поймем, по какой причине.
В достаточно большой и представительной выборке из предложений какого-либо языка дистрибуции разных слов будут в значительной мере совпадать. Например, вместо milk 'молоко' можно поставить beer 'пиво', water 'вода', gin 'джин' и т. п. не только в I drink a pint of milk; этот же ряд слов мог бы появиться и во многих других окружениях, в которых может встретиться milk. Аналогично, слова they 'они', we 'мы' и you 'вы' могут заменить I 'я', a buy 'покупать', take 'брать', order 'заказывать' и т. д. могут заменить drink 'пить' во многих других окружениях, кроме нашего предложения. Слова, которые, как правило, способны заменять друг друга в целом ряде различных предложений, можно сгруппировать на этом основании в дистрибуционные классы.
Допустим, что нам необходимо проанализировать корпус материала, состоящий из следующих 17 «предложений»: ab, ar, pr, qab, dpb, aca, pca, pcp, qar, daca, qaca, dacp, dacqa, dacdp, qpcda, acqp, acdp. Разными буквами обозначены разные слова: условная запись используется из соображений общности, а также чтобы пояснить, что на данном этапе мы обходимся без непосредственного привлечения семантики. (Впрочем, это может вызвать известные сомнения, поскольку мы исходим из того, что приемлемость сохраняется при операции замены, а понятие «приемлемости» включает «осмысленность». Мы, однако, стремимся разграничить «грамматическую правильность» и «осмысленность», хотя еще не достигли этого.) Мы видим, что а и р имеют некоторые общие окружения (ср.
– r, pc– , dac– ), так же как b и r (ср. a– , qa– ) и d и q (ср. dac– a, -аса, ас– р), но что с имеет уникальную дистрибуцию (а– а, р– а, р– р, qa– a, da– a, da– p и т. д.) в том смысле, что ни в одном окружении, в котором встречается с, не встречается никакое другое слово. Теперь поместим а и р в класс X
Пока мы можем удовлетвориться описанием предложений нашего корпуса в терминах их линейной структуры, то есть на языке следующих формул или правил:
(1) XY
(2) ZXY
(3) XcX
(4) ZXcX
(5) ZXcZX
(6) XcZX.
Можно считать, что каждое из этих правил описывает отдельный тип предложения. (Тот факт, что можно свести эти типы предложений к подтипам, привлекая принципы структуры составляющих, не релевантен на данном этапе изложения; см. § 6.1.2 и сл.) Заметим, что эта система правил удовлетворительно объясняет приемлемость семнадцати предложений корпуса (она определяет их как грамматичные). Но это достигается только путем включения имеющихся предложений в общее множество из 48 предложений в качестве его элементов. (Число 48 получается после применения формулы, приведенной в § 2.3.8, к каждому из шести типов предложения и суммирования результатов.) Имеется 2 x 2 = 4 предложения типа (1), 2 x 2 x 2 = 8 предложений типа (2), 2 x 1 x 2 = 4 предложения типа (3), 16 предложений типа (4), 8 — типа (5) и 8 — типа (6). 4 + 8 + 4 + 16 + 8 + 8 = 48. Поэтому язык, описываемый такой грамматикой, содержит ровно 48 предложений. Тридцать одно не встречающееся предложение можно допустить в качестве приемлемых или исключить, если мы почему-либо решим, что они должны быть исключены посредством дополнительных правил, запрещающих определенные сочетания отдельных слов. Дополнительные правила, очевидно, весьма усложнят «грамматику». Следовательно, наиболее экономным способом описания данного текста будет такой, который представит его как случайную выборку из 17 предложений, являющихся подмножеством общего множества из 48 предложений, которые и составляют язык. «Грамматика», построенная нами для описания этого текста, является генеративной в описанном выше смысле (см. § 4.2.2). Мы будем говорить, что она порождает, или характеризует, язык текста, приписывая каждому из имеющихся в «выборке» предложений (так же как и тем, которых нет в «выборке») особое структурное описание: pr — это предложение структуры XY, pcda — структуры XcZX и т. д.
Этот ограниченный искусственный язык, использованный нами в качестве примера, содержит всего семь слов, а корпус включает лишь семнадцать простых предложений (из сорока восьми, порождаемых грамматикой). В случае естественных языков ситуация, без сомнения, оказывается значительно более сложной. Число слов выражается в десятках тысяч; их дистрибуционная классификация будет не столь простой и, несомненно, не сможет быть осуществлена только что проиллюстрированным способом. Кроме того, нам придется описывать целый ряд различных типов предложений, в том числе предложения значительной степени сложности. Однако эти факты не затрагивают самого принципа. Слова естественного языка могут быть сгруппированы в дистрибуционные классы (что всегда и делалось составителями грамматик на практике, как мы увидим ниже); дистрибуционные классы, установленные для конкретных позиций в предложениях одного типа, оказываются обычно действительными и для конкретных позиций в других, более сложных типах предложений. Грамматика, как она здесь понимается, есть не что иное, как описание предложений языка в терминах сочетаемостных свойств слов (а также словосочетаний и т. д.), определяемых их принадлежностью к тому или иному дистрибуционному классу. Это род алгебры, в которой в качестве «переменных» выступают словесные классы, а в качестве «постоянных», или «значений», принимаемых этими переменными в конкретных предложениях, — индивидуальные слова.
Чтобы понять, что речь идет в принципе о такого рода описании, которое обычно называется «грамматическим», нам достаточно интерпретировать приведенный выше пример применительно к английскому языку. Пусть a = men 'мужчины', р = women 'женщины', b = live 'живут', r = die 'умирают', c = love 'любят', d = old 'старый (~ые, ~ых)', q = young 'молодой (~ые, ~ых)'. Другими словами, пусть класс X включает все те слова, которые обычно обозначаются как 'существительные во множественном числе'; пусть Y символизирует класс «непереходных глаголов», с — класс «переходных глаголов» и Z — класс «прилагательных». Наше утверждение о допустимых сочетаниях классов слов означает, что такие предложения, как Men die, Old men love young women и т. д., которые описывались традиционной грамматикой как случаи «субъектно-предикатной» конструкции, грамматически приемлемы, тогда как *Die men или *Old love young men women и т.п. неприемлемы.
4.2.9. ГРАММАТИЧЕСКИЕ КЛАССЫ
В традиционной грамматической теории «части речи» (существительные, глаголы, прилагательные и т. д.) определялись — явным образом — в «понятийных» терминах («существительное — это название лица, места или вещи» и т. п.). Но, как мы увидим ниже (см. § 7.6.1 и сл.), рассматривая «части речи», традиционные грамматики нередко смешивали две различные проблемы. Первая, которая нас здесь и занимает, — это вопрос об определении условий, при которых можно считать, что данное слово принадлежит к тому или иному грамматическому классу: «Является ли слово men членом класса X или же класса Y?» На деле это всегда определялось на основе дистрибуции слова — возможности его встречаемости в предложениях в связи с наличием в тех же предложениях других слов. В этом смысле современная лингвистика лишь признала в грамматической теории дистрибуционный принцип, которым традиционные грамматики всегда руководствовались' на практике. Таким образом, «формальная» грамматика отличается от «понятийной» теоретическим признанием указанного принципа. Вторая проблема имеет отношение к наименованию грамматических классов (установленных — что касается составляющих их элементов — на «формальной» основе): «Уместно ли называть X классом «существительных»?» С точки зрения «формальной» грамматики, всякое обозначение так же хорошо, как и любое другое; и традиционные термины «существительное», «глагол», «прилагательное» и т. д. не более и не менее удовлетворяют этой цели, чем любые другие термины.