Алло, робот
Шрифт:
Переводческая машина Троянского представляла собой автоматический словарь. Ведь именно поиск нужного слова занимает большую часть времени при переводе с языка на язык. Человек, по мысли Троянского, сначала подготавливает иностранный текст: все изменяемые слова записываются в основных формах. Существительное — в именительном падеже и единственном числе, глагол — в инфинитиве, и т. д. Например, слова «приказывающий машинам» были бы записаны как «приказывать машина». Правила грамматики, или, как называл их Троянский, «знаки логического разбора», также ставятся человеком, «препарирующим» текст.
Затем машина заменяет слова препарированного текста на слова чужого языка. Разумеется, они также даются
В этом проекте автоматического перевода машина выполняет самый трудоемкий, но промежуточный этап работы. Изобретатель, однако, указывал, что в принципе можно поручить машине весь процесс перевода. Она сама будет препарировать текст на одном языке и делать «обратное препарирование» на другом. Ибо грамматика, записанная в виде четких логических правил, также может быть доступна механическому переводчику.
Для того чтобы воплотить свой проект в жизнь, Троянский предложил в 1933 году модель переводческой машины. Она состояла из передвигающейся по столу ленты с нанесенными на ней словами на различных языках. Принцип работы был чисто механический. Это и понятно — ведь в то время не было не только кибернетики, но и электронных вычислительных машин.
В 1941 году изобретатель построил электромеханический вариант своей машины. А в 1948 году предложил сделать ее на электромагнитной аппаратуре связи. Но все эти модели так и не получили путевки в жизнь. Не было необходимой технической базы — электронных вычислителей-гигантов. Именно им был поручен машинный перевод.
«МЫ МОГЕМ СДЕЛАТЬ»
В конце 40-х годов вопрос о возможности машинного перевода только обсуждался американскими и английскими учеными; в 50-х началась совместная работа математиков и лингвистов. В январе 1954 года в конторе фирмы «Интернейшнл бизнес мэшинз» была проведена первая публичная демонстрация перевода с русского языка на английский. В конце следующего года был проведен первый опыт машинного перевода в нашей стране.
Идея Троянского о том, что перевод с помощью машины надо членить на части, «препарировать» текст, получила практическое подтверждение. Только «препарирование» это производит сама машина. Вот как выглядит схема автоматического перевода с русского на английский:
Программа, вложенная в «память» машины, должна учитывать грамматику языка, с которого переводится текст. Точно так же нужно учесть и грамматику языка, на который переводится текст; конечно же, нужен англо-русский словарь, если переводят с английского на русский язык, и т. п.
Все это — и правила грамматики, и словарь — записывается в виде чисел. В последовательность чисел преобразуется и текст, который нужно переводить. Сделать это нетрудно. Каждую букву надо обозначить числом, например: а = 00, б = 01, в = 02, и т. д. Любой текст таким образом можно перевести на машинный язык чисел. Точно так же в виде чисел записывают и словарь.
Первый опыт машинного перевода в нашей стране был проделан под руководством Д. Ю. Панова. Машина БЭСМ переводила с английского языка на русский. Вот как выглядели некоторые английские слова в числовой записи:
the = 212608 (21 — t, 26 —h, 08—е);
method = 110821262830 (11 —m, 08 —e, 21—t, 26 —h, 28 —o, 30 —d).
Встретив
в тексте, который нужно переводить, последовательность чисел 212608 110821262830, машина легко может сопоставить их с записанными в «памяти» такими же последовательностями чисел и дать русский перевод — «метод».А как быть с записью грамматики? Например, в английском языке есть артикли, а в русском их нет. Зато в русском языке есть показатель рода, отсутствующий в английском. В других языках, например полинезийских, вообще отсутствуют грамматические формы склонения,
спряжения, рода — их передают служебные слова, а не грамматические окончания.
Поэтому в словарь для машинного перевода рядом со словами ставят целый ряд их дополнительных признаков. Например, указывают род, склонение, обозначает ли данное слово одушевленный предмет. Вот часть из такого англо-русского машинного словаря:
31. Alternate — чередоваться (глагол I спряжения).
32. Altogether — вообще (наречие).
33. Among — среди (предлог-+-родительный падеж).
Конечно, в «памяти» машины эти грамматические категории также обозначаются числами: существительному соответствует число 1, глаголу — 2, и так далее.
Поиск слов в словаре машина делает с огромной скоростью. И точность ее действия весьма велика. С грамматикой дело сложней. Например, при переводе с английского машина «выдала» такую русскую фразу: «Так что хочем ли знать будущий путь Юпитера в небесах или путь электрона в электронном микроскопе». А при переводе с французского на русский: «Мы могем сделать».
Грамматика может хромать и у машины! Впрочем, машина здесь не виновата. Просто составители программы не включили нужное правило, вернее, исключение из правила. В самом деле, если фразы «я прыгаю», «я бегаю» во множественном числе будут «мы прыгаем», «мы бегаем», то почему бы «я могу» не стало во множественном числе «мы могем»? Машина так и сделала, подобно тому как иногда поступают и маленькие дети, обучающиеся языку. И дети, и электронная машина-переводчик добросовестно и последовательно соблюдают все правила языка и только потом узнают, что, кроме правил, есть еще и исключения из них.
ТЬМА-ТЬМУЩАЯ
Почти одновременно с опытом машинного перевода на БЭСМ был проделан и другой эксперимент на машине «Стрела» под руководством О. С. Кулагиной. Машина переводила с французского на русский язык. И хотя опыт Кулагиной не получил широкой известности, как опыт машинного перевода на БЭСМ, он имеет, по мнению специалистов, гораздо большее значение для дальнейших работ в области машинного перевода. Ведь первые переводы, сделанные с помощью электронной вычислительной машины, были лишь опытами. Для того чтобы поставить машинный перевод «на широкую ногу» (добиться, чтобы, вложив в машину книгу на одном языке, мы могли через некоторое время получать перевод на другом), предстоит много работы.
Первый машинный перевод, например, был сделан с помощью словаря из 250 слов. И лишь шесть грамматических правил «управляли» этими словами.
Одно и то же слово может иметь множество значений. В опытах по машинному переводу брались только те слова, которые имели одно, в крайнем случае, два значения. Но здесь возникает трудность — какие из значений выбрать? Машина переводит в полном смысле слова «автоматически», не понимая смысла текста. Какое, например, русское слово выбрать, переводя английское слово «instance», — «инстанция» или «пример»?