Чтение онлайн

ЖАНРЫ

Шрифт:

Если описание объекта можно легко формализовать – например, в качестве признаков используются числа, наличие или отсутствие какого-либо элемента и т.п. – почему бы не поручить задачу распознавания вычислительной машине?

Пусть, для простоты, признаков только два, и оба – числа. Например, имеются результаты обследования ребятишек в детском саду; выяснилось, до скольких ребенок умеет считать (признак a) и измерялся его рост (признак b). Представим графически данные, относящиеся к двум группам, старшей и младшей, откладывая по оси абсцисс признак a, а по оси ординат – признак b, так что каждому объекту (ребенку) будет соответствовать точка. Окончив эту работу, мы убедимся, что точки располагаются на графике двумя «роями» – один поближе к началу координат, другой – подальше от него; если же при построении мы наносили разными цветами точки, соответствующие объектам младшей (зеленые) и старшей (красные)

групп, мы обнаружим, что совершенно очевидно первый рой образован почти исключительно зелеными точками, второй – красными.

Вычислим средние значения признаков aи bдля двух групп и пометим соответствующие точки на графике (центры групп). Можно предложить следующее решающее правило: данный объект принадлежит той группе, ближе к центру которой расположена соответствующая ему точка. Это – пример так называемой геометрической интерпретации задачи распознавания образов. Если теперь нам предстоит определить на основании параметров aи b, к младшей или старшей группе принадлежит данный курносый объект, нам достаточно нанести на график соответствующую точку, измерить расстояния до центров первой и второй групп и сравнить их между собой. ЭВМ, разумеется, такую процедуру выполняет безо всяких графиков, расчетным путем. Обучение в данном случае заключалось в вычислении средних для двух групп.

Внимательно исследовав еще раз график, мы обнаружим, что принятое нами решающее правило срабатывает не всегда: пара зеленых точек расположена ближе к «красному» центру, чем к своему, «зеленому», и наоборот. Действительно, может иногда встретиться в младшей группе вундеркинд, считающий, скажем, до тысячи, а если он к тому же и ростом заметно обогнал сверстников – наша процедура неминуемо совершит ошибку и отнесет его к старшей группе. Причем такие случаи вовсе не являются следствием несовершенства решающего правила: полностью безошибочная классификация на основании только значений параметров aи bздесь невозможна в принципе, а полученное указание на принадлежность объекта именно этой группе следует трактовать таким образом, что он с большей вероятностью относится к ней, чем к другой. (Вспоминается консилиум у постели Буратино: «Пациент скорее жив, чем мертв».)

Существует много способов вычисления этой вероятности; ясно, что такого рода оценку можно сделать уже на основании величин расстояний от рассматриваемой точки до двух центров. На нашем графике нетрудно провести прямую, точки которой в равной степени удалены от каждого из них, и если точка, соответствующая некоторому объекту, расположится именно на ней, мы с помощью нашего решающего правила вообще ничего не сможем сказать о принадлежности объекта той или иной группе.

Очень, конечно же, большое значение имеет выбор параметров, на основании которых происходит распознавание. В рассмотренном примере этот выбор был удачным в том отношении, что параметры aи bнезависимы (рост и умственное развитие ребенка в данном возрасте необязательно взаимосвязаны). Кроме того, что еще важнее, оба параметра являются существенными, то есть действительно в среднем различны в двух группах, или, как еще говорят, несут информацию о принадлежности объекта одной из групп.

Что же случается, если избранные параметры не удовлетворяют этим требованиям? Проиллюстрируем это на примерах. Пусть мы вначале решаем нашу задачу, используя всего один параметр – рост. Соответствующие различным объектам точки и центры групп располагаются в этом случае на прямой. Мы убедимся, что качество классификации ухудшится. В самом деле, если какой-то мальчуган из старшей группы ростом не вышел, он будет отнесен неправильно (на прямой соответствующая точка расположится, не доходя середины отрезка между двумя центрами); при классификации же на основании двух параметров расстояние до «неправильного» центра окажется уже большим в силу сдвига соответствующей точки по второй оси, параметру a, поскольку по умственному развитию наш объект находится вполне на уровне своего возраста.

Что произойдет, если в качестве второго параметра мы возьмем не независимое от роста умение считать, а величину, связанную с ростом, – например, вес? Точки на нашем графике расположатся узкой восходящей полоской, причем у верхнего ее конца сосредоточатся красные, у нижнего – зеленые. Качество классификации почти не улучшится: второй параметр несет мало дополнительной информации, чаще всего у ребят большего роста окажется и больший вес.

Выбор для описания объекта взаимозависимых (коррелированных) параметров, однако, ошибка не самая страшная; это лишь затрудняет вычисления, но не оказывает отрицательного влияния на результат. В отличие от этого введение несущественных параметров, значения которых не зависят от того, какой группе принадлежит объект, очень сильно сказывается на качестве распознавания, часто делая процедуру вообще неработоспособной.

Действительно, предположим, что в качестве второго параметра мы избрали нечто, совершенно не содержащее малейшего намека на принадлежность ребенка той или иной группе – скажем, номер квартиры, в которой он проживает. В этом случае

наш график будет выглядеть следующим образом: ближе к началу координат вертикальной полосой расположатся зеленые точки, к ней будет примыкать и частично пересекаться же полоса зеленых точек. Часто будет наблюдаться такая ситуация: точка близка «своему» центру по существенному параметру – росту, но сильно удалена по значению параметра несущественного – номеру квартиры. В результате различие в расстояниях от нее до каждого из центров станет незначительным, а из-за небольшой даже разницы средних значений второго параметра в двух группах возможны неправильные отнесения. Введение второго, несущественного параметра, таким образом, ухудшает качество предсказания «Под влиянием таких параметров может происходить разнесение объектов одного класса и сближение объектов разных классов. Это явление лежит в основе так называемой «теоремы о гадком утенке»... (Ее доказательство и название принадлежит японскому ученому Ватанабэ. – С.Г.). Своим названием теорема обязана одному из ее частных следствий, согласно которому в таком пространстве расстояние между гадким утенком и лебедем будет таким же, как между двумя лебедями». Это цитата из книги А.Б. Розенблита и В.Е. Голендера «Логико-комбинаторные методы в конструировании лекарств» – несомненно, одной из лучших на русском языке монографий по проблеме анализа связи структура – активность. Книга эта, написанная на самом современном научном уровне, доступна тем не менее во многих частях также и непрофессионалам. Кроме того, ее очень украшают встречающиеся там и сям симпатичные искорки юмора. Пример – прямо на второй странице: «Тираж 300 экземпляров»; естественно, было бы просто издевательством отсылать к ней читателя, желающего глубже ознакомиться с этими вопросами.

Непосредственная связь с магией

Не счесть всех постыдных поражений и глупейших конфузов, кошмарных провалов и опереточных таки ошибок, выпавших на долю тех мужественных и изобретательных людей, которые впервые взялись за внедрение методов теории распознавания образов в различных прикладных областях.

Социология, лингвистика, экономика, геология, ботаника – где только не пробовали они свои силы; как мы знаем, в фармакологии и токсикологии тоже. Их приход в каждую из этих областей встречался сначала с большим энтузиазмом, затем следовали первые результаты – и они решительно всех разочаровывали. ЭВМ, напичканная массой всяческой информации и снабженная программами, в которых реализовались мудреные алгоритмы, с трудом отличала, образно говоря, зайца от барашка (есть абхазская пословица: «Похож, как заяц на барашка») и уж полностью была бессильна в ситуациях менее очевидных, хотя все еще тривиальных с точки зрения специалистов. В шестидесятые годы, когда происходило становление теории распознавания образов, часто с эстрады звучала басня о некоем незадачливом руководящем Медведе, привыкшем подбирать кадры исключительно на основании анкеты:

...Рассмотрим данные, картина такова:

Ноги четыре, уха два,

Шерсть тона светлого, длинней всего на холке.

Имеет хвост, украшенный метелкой,

Способен оглушительно реветь...

«Так это ж лев!» – разинул рот медведь.

При ближайшем рассмотрении обладатель анкеты оказался ослом. В этой истории, как в капле воды, отражены неприятности, подстерегающие авторов распознающих программ; в частности, сразу бросается в глаза использование малоинформативных признаков: «ноги четыре» и в особенности «уха два».

За прошедшие с тех пор два с лишним десятилетия теория распознавания образов значительно шагнула вперед, и во многих сферах использование ее методов для решения различных прикладных задач стало повседневной практикой. К сожалению, этого нельзя пока сказать о задачах выявления связи структура – активность, хотя и на этом пути достигнут определенный прогресс.

Один из важнейших уроков истории развития методов теории распознавания образов заключается, по-видимому, в выводе, что нет надежд на получение универсальных, пригодных в равной степени для всех задач методов; каждый узкий класс задач требует создания строго ориентированных процедур, учитывающих специфику задачи. Даже при исследовании проблемы связи структура – активность наметилось несколько направлений, требующих развития различных подходов в зависимости от поставленных целей и круга изучаемых соединений; при этом именно в силу специфики задачи некоторые из них выходят за традиционные рамки методов теории распознавания образов.

Рассмотрим подробнее в качестве примера так называемый логико-структурный подход к изучению связи структура – активность, развиваемый упоминавшимся А.Б. Розенблитом и В.Е. Голендером.

Сами авторы объясняют отличие своего подхода от традиционных методов теории распознавания образов следующими словами: «При исследовании проблемы связи структура – активность методы распознавания образов представляются нам недостаточными потому, что основная их цель – найти решающее правило классификации объектов. Для нас же не только важно найти решающее правило, с помощью которого можно было отнести данное соединение к определенному виду (или нескольким видам) активности, но. не менее важно на основе обучающей последовательности выявить структурные признаки, руководствуясь которыми химик мог бы синтезировать новые соединения с наперед заданной активностью. Разумеется, важно иметь оценку достоверности признака».

Поделиться с друзьями: