Чтение онлайн

ЖАНРЫ

Искусственный интеллект. Что стоит знать о наступающей эпохе разумных машин
Шрифт:

Переводчики от Google и Microsoft (тот самый, который Рик Рашид продемонстрировал в Китае) обучались в примерно одинаковых условиях: не зная о языке ничего, кроме относительной частоты использования огромного количества последовательностей слов. И все же Google может на достаточно хорошем уровне переводить на 135 письменных языках, начиная африкаанс и заканчивая зулу. Эти ИИ проводят пословный анализ текста, который сводится к расчету вероятности следующего используемого варианта. Для них слова – это набор вероятностей.

Основы

алгоритма перевода более или менее понятны. Сложность возникает из-за большого количества сопоставлений, которые происходят между огромными объемами данных. Например, для того чтобы выстроить прогноз об окружающей обстановке, беспилотные автомобили Google каждую секунду собирают почти гигабайт данных. А Amazon нет равных по части того, как заставить людей купить больше, – алгоритм подбирает рекомендации товаров, основанные на миллиардах сопоставлений из миллионов других заказов.

Перевод речи Рашида – то есть обработка того, что он сказал голосом, с дальнейшим мгновенным переводом – лишний раз показывает, насколько мощным может быть статистический ИИ. «Эти системы не творят чудеса», – говорит Крис Бишоп из Microsoft. «Но мы не перестаем удивляться тому, как далеко можно продвинуться, просто просматривая статистику очень больших наборов данных».

«Вам также может понравиться»

Если такой подход к разумности кажется вам обманом, поскольку сам алгоритм не является разумным, то готовьтесь – худшее еще впереди.

Следующим по сложности шагом после функции автозаполнения идет агент по выдаче рекомендаций. Вспомните свой любимый онлайн-магазин. Изучив ваши предыдущие заказы или даже просто историю просмотров на сайте, этот агент постарается отыскать в своем каталоге товары, которые с наибольшей вероятностью смогут вас заинтересовать. Они подбираются путем анализа базы данных, содержащей миллионы транзакций, поисковых запросов и товаров. Также впечатляет и количество параметров, которые потребуется извлечь из обучающего набора: в каталоге Amazon зарегистрировано свыше 200 миллионов клиентов и 3 миллионов книг.

Сопоставление пользователей с товарами на основании предыдущих операций требует статистического анализа колоссального масштаба. Как и в случае с функцией автозаполнения, традиционного понимания здесь не требуется, так как для подбора рекомендаций не нужны психологические модели покупателей или литературная критика новел. Поэтому неудивительно, что возникает закономерный вопрос: а следует ли вообще называть таких агентов «разумными»? Тем не менее никаких сомнений о самом «обучении» быть не может: с накоплением опыта такие агенты действительно становятся лучше.

Имитация поведения

Многие вещи со временем усложняются. Онлайн-магазины отслеживают не только покупки, но и пользовательское поведение на сайте. Они могут собирать различную информацию, например товары, которые вы сначала положили в корзину, а затем удалили из заказа, или артикулы, которые вы оценили или добавили в список пожеланий. Есть и другая информация, которую можно получить из одной покупки: время суток, адрес, способ оплаты и даже время, потраченное на оформление заказа. Разумеется, все это подсчитывается для миллионов пользователей.

Поскольку

поведение покупателей, как правило, достаточно однообразно, данный массив информации можно использовать для постоянного совершенствования работы агента. Ряд алгоритмов обучения способен динамически адаптироваться к новым условиям, другие же периодически переучиваются в автономном режиме. Но все они используют множество сигналов, полученных в результате наших действий, для коррекции своего поведения. Таким образом они постоянно изучают и отслеживают наши предпочтения, поэтому неудивительно, что временами мы покупаем совершенно не тот товар, которые изначально планировали.

Интеллектуальные агенты могут даже предлагать какие-то товары, чтобы отследить нашу реакцию. Такой способ получения информации по своей ценности ничем не уступает оформлению покупки. Интернет-магазины выступают в роли автономных обучающих агентов, постоянно находящихся на тонкой грани между изучением и эксплуатацией покупателей.

Изучение того, что агенты не знали о вас, может оказаться столь же важным, как и фактическая продажа товара. Проще говоря, агенты любопытны. Эта же стратегия используется спам-фильтрами и другими приложениями, которые должны изучить ваши предпочтения для прогнозирования дальнейших действий. В один прекрасный день техника для дома будет также заинтересована в прогнозировании ваших следующих действий.

Это лишь простейшие примеры. Используя такие же или схожие статистические методы в разных частях и масштабах системы, компьютеры могут научиться распознаванию лиц, транскрибированию речи и переводу текста с одного языка на другой. Если верить некоторым компаниям, специализирующимся на онлайн-знакомствах, то и здесь можно задействовать агентов по подбору потенциальных партнеров. Иными словами, агенты способны подражать сложному человеческому поведению, которое мы не можем полностью смоделировать, и делают они это совершенно не так, как мы.

Новые ситуации

Машинное обучение – это не только анализ поведения в уже произошедших событиях. Иногда ИИ приходится сталкиваться с новыми ситуациями. Как помочь новому клиенту? Кому порекомендовать новую книгу? В данном случае вся хитрость в том, чтобы научить машины обобщению на основании данных от схожих клиентов или товаров.

Даже новый клиент, который никогда не пользовался данным сервисом, оставляет небольшой информационный след (например, свое местоположение или адрес электронной почты). Способность к обнаружению и использованию сходств иногда называют «распознаванием образом», причем такая способность важна не только на этапе «холодного» старта. На самом деле обобщение (то есть обнаружение закономерностей и сходств) является основой разумного поведения.

Что мы имеем в виду, говоря, что два элемента похожи? Книгу можно описать по количеству страниц, языку, тематике, цене, дате выхода, автору и даже индексу ее читабельности. Если говорить о покупателях, то нужными характеристиками могут считаться возраст, пол или местоположение клиента. В машинном обучении такие характеристики иногда называют «признаками» или «сигналами». При достаточности данных ими можно пользоваться для поиска похожих объектов. Таким образом, машина может делать общие выводы об одной ситуации и применять их к другой, благодаря чему совершенствуется ее опыт.

Поделиться с друзьями: