Чтение онлайн

ЖАНРЫ

Шрифт:

А.Г. Научившегося уже…

А.Ж. Вот здесь мы видим уже, когда он достаточно поумнел для того, чтобы не ударяться лбом в препятствие. Вы видите, что он видит препятствие: сектор, изображённый впереди робота – это его поле зрения. И он вовремя отворачивает от препятствия, как только его заметил. То есть он решил эти задачи, он понял, что ударяться – это больно. Второе, он понял, что надо поворачивать. И третье, он понял, как это надо делать, где надо сдавать задним ходом, где надо поворачивать руль вправо, где надо поворачивать руль влево. То есть он учится у нас на глазах.

Я вам могу эту программу запустить, она достаточно долго работает. Он у нас на глазах выработал такой способ поведения. На самом деле это достаточно интересно.

Если

мы будем ставить перед этим роботом другие задачи (из этого угла переехать в тот, или, скажем, найти какие-то полезные батарейки, чтобы подзарядиться и т.д.), эти задачи можно будет решать на базе этого робота. Спасибо, оставьте, пожалуйста, эту картинку. На этом графике показано число соударений робота с препятствиями в единицу времени. Видно, что это число уменьшается со временем. То есть по мере того, как робот обучается, число соударений уменьшается до нуля.

Хотелось бы ещё два слова сказать о том, что (пожалуйста, следующий слайд покажите), эта система управления построена на специальных нейроноподобных элементах. Потому что мы пытались всё-таки до конца идти этим путём и смоделировать нервную систему не только по её функциям, но и по её устройству. Разработали несколько специальных моделей нейронов. Это не те нейроны, которые используются в современных искусственных нейросетях. Это такие нейроны, которые ищут корреляцию входных сигналов, причём обучаются без учителя, самостоятельно. И самый простой из этих нейронов показан на этой картинке. Из этих нейронов можно собрать все подсистемы управляющей системы, о которой я говорил. И блок формирования распознавания образа, и базу знаний, и принятие решений, и аппарат эмоций. То есть можно собрать всю эту систему управления.

Это не есть система распознавания, как в обычных нейросетях. Эта система, о которой я говорю, есть система управления, которая адаптивно управляет роботом. Там есть блок распознавания, но это только один из блоков.

А.Г. Увеличение количества нейронов ведёт к уменьшению времени эксперимента или нет?

А.Ж. Ну, конечно. Безусловно, здесь очень много зависит от количества этих нейронов. Минуточку, ещё назад, пожалуйста, вернитесь, не забегайте. Вот здесь показан кусочек базы знаний, в данном случае – это трехмерная матрица, где каждый нейрон получает информацию об условии, которое было, о действии, которое он совершил, и о результатах, которые из этого получились. И некоторые нейроны, те, которые как бы поймали закономерные эти троечки – условия, действие и результат – они обучились, я их там выделил жёлтым светом.

В.Н. А они способны переучиваться?

А.Ж. Это зависит от того, как вы этот нейрон устроите. Я считаю, что биологические нейроны в своём зрелом возрасте плохо переучиваются.

В.Н. То есть получается, что число всякого рода форм поведения, которое ваша система способна выучить, определяется числом нейронов в ней. Пока есть свободные нейроны, до тех пор она учится?

А.Ж. Даже не совсем так. В каком-то смысле так, но не все нейроны будут обучены к концу жизни. И тут, как ни странно, на основании такой схемы можно устроить практически полезные системы. Вот на этом слайде показан прототип системы управления для активной подвески автомобиля, где система адаптируется к свойствам этого автомобиля. Предполагается, что эта подвеска оснащена некоторым активным элементом, который может автомобиль подталкивать вверх-вниз, при этом управляющая система со временем понимает, как это делать. Внизу нарисована база знаний, которую эмпирическая система получила, она отражает свойства данного конкретного автомобиля: как этот автомобиль реагирует на то или другое воздействие. Пользуясь этими знаниями, система может так аккуратно управлять этой подвеской, что она сглаживает нежелательные колебания и заставляет автомобиль двигаться так, как вам надо.

Вот слева график: это сильные колебания автомобиля, обычного автомобиля при наезде, скажем, на препятствие. Справа мы видим гораздо более гладкую

кривую. Очень интересная, такая практически полезная вещь.

В.Н. А можно вам вопрос? С какой скоростью она учится? Скажем, можно сопоставить её скорость обучения со скоростью обучения водителя: вот человек купил новый автомобиль, и он к нему приспосабливается. И ваша система…

А.Ж. Наверное, можно сопоставить. Конечно, здесь очень много зависит от процессора, от различных деталей, и т.д. Можно обучаться с нуля, можно заставить переучивать некую среднюю базу знаний, заранее, скажем, накопленную. Тут очень много различных вариантов. Но в принципе, естественно, есть период, когда она учится, больше учится, чем управляет. Но постепенно доля управления становится больше, чем доля обучения.

Покажите, пожалуйста, следующую картинку. Примерно похожая адаптивная система управляет угловым движением спутника. Я хочу обратить внимание, что в эту систему не закладывается математическая модель объектов в том виде, как это обычно делается. Там нет системы дифференциальных уравнений, где какие-то коэффициенты надо было бы уточнить. Тут совсем нет этой системы. Здесь знание – это, скорее, некоторое отображение из множества в другое множество. Из множества образов, множества действий, множества образов, которые отражают результаты. Это ещё связано с оценками. И вот эти отношения элементов этих множеств система и находит. База знаний имеет именно такой смысл.

В данном случае, очень полезная система, потому что точную математическую модель космического аппарата, его углового движения, построить очень трудно, потому что вы не можете на Земле очень точно померить различные коэффициенты, которые входят в эту модель, потому что вы не можете воспроизвести вакуум, не можете произвести невесомость на Земле. Не можете воспроизвести перепады температуры, ещё что-то.

В конце концов, что-то может сломаться в космосе, или заклинить, и реакция этого объекта на то или другое воздействие будет не такой, как вы заложили в модель. И качество будет другое.

А вот эта системка может прямо по ходу дела адаптироваться именно к тому объекту, который вы ей дали.

А.Г. У нас очень мало времени. Я прошу прощения, я бы хотел, чтобы вы напоследок задали те вопросы, на которые у вас пока нет ответов. Для того чтобы понять, куда вместе вы можете идти дальше. Я имею в виду две науки.

А.Ж. Если вы запустите третий клип в это время, я сейчас покажу связь. Здесь видно, как на верхнем графике объект, который должен выправляться, становится глаже по мере того, как база знаний справа заполняется. Обратите внимание, внизу – действие. Вы видите эти две моды: поисковый режим, небольшой разброс пробных действий. Он сменяется резкими широкими скачками.

Посмотрите, как этот поиск постепенно будет сходиться, и по мере того как знаний становится всё больше и больше, верхняя кривая, в конце концов, станет другой: посмотрите, как аккуратно он управляет отдельными слабыми толчками. Это похоже на то, как ребёнок учится ездить на велосипеде. Вначале есть какие-то грубые, несуразные движения, он падает. Но постепенно он находит правильные манёвры. И вот он ещё едет, дёргая руль, и потом вдруг он едет уже ровно.

А.Г. И всё-таки…

В.Н. И собственно, тогда вопрос: возвращаясь к ручейнику, можно ли на основе этой системы управления создать робота, который выработал бы такую же или похожую, столь же эффективную или столь же неэффективную систему поиска, как у ручейника? Как вам это представляется на основании моего рассказа, который ничего не говорит о механизмах, а говорит только о правилах поведения?

А.Ж. Я думаю, что поведение нашей системы, которое я сейчас показал, предшествует той тактике поведения, которую демонстрирует ручейник – это выработка элементарных рефлексов. Но следующие модели поведения уже, видимо, будут сравнимы с ручейником. Хотя на графике, который мы видели последним, показано, как мода небольших колебаний сменялась широкими пробными скачками.

Поделиться с друзьями: