Чтение онлайн

ЖАНРЫ

Внедрение искусственного интеллекта в бизнес-практику. Преимущества и сложности
Шрифт:

На основании этого можно сделать вывод о существовании еще одной сложности в использовании ИИ на предприятиях: дело в том, что технологий ИИ достаточно много и большинство из них можно применять несколькими способами, приспосабливая для выполнения различных функций. Комбинации технологий и функций достаточно сложны – настолько, что исследователь ИИ Крис Хэммонд даже предложил «периодическую систему» ИИ [12] . Далее приведена таблица, в которой перечисляются семь ключевых технологий, дается краткое описание каждой из них, а также называются сферы их применения и типичные функции.

12

Kris Hammond, "A Periodic Table of AI," AI XPrize website, December 14, 2016, https://ai.xprize.org/news/periodic-table-of-ai.

Я

также опишу, насколько распространена каждая из технологий в мире бизнеса. Я работаю со многими компаниями и прежде всего являюсь профессором в бизнес-школе, но также занимаю должность старшего советника по стратегии и аналитике в Deloitte, что предполагает оказание консалтинговых услуг по вопросам искусственного интеллекта. В 2017 г. я помог подготовить и проанализировать опрос, в котором приняли участие 250 американских работников руководящего звена, осведомленных о когнитивных технологиях, то есть работающих в организациях, активно использующих такие технологии, и понимающих принципы их применения. В первую очередь участников опроса спрашивали, какие технологии используются в их компаниях.

Ниже приведена таблица, в которой подробнее описывается каждая из технологий и сфера ее применения.

Статистическое машинное обучение

Машинное обучение – это техника автоматической подгонки моделей к данным и «обучения» посредством тренировки моделей данными. Машинное обучение представляет собой одну из самых распространенных форм ИИ: в проведенном в 2017 г. опросе Deloitte 58 % из 250 «осведомленных о когнитивных технологиях» руководителей, компании которых уже внедряли ИИ, ответили, что в их бизнесе используется машинное обучение. Эта техника лежит в основе многих решений в сфере искусственного интеллекта и имеет множество вариантов. Резкий рост объемов данных внутри компаний и – особенно – за их пределами сделал возможным и необходимым применение машинного обучения для осмысления всей этой информации.

Более сложную форму машинного обучения представляет собой нейронная сеть – доступная с 1960-х гг. технология, которая используется для категоризации, например для выявления мошенничества в сфере кредитных операций. Она рассматривает каждую задачу как совокупность входящих и исходящих данных, а также переменных или «функций» различного веса, которые связывают входящие данные с исходящими. Работа этой технологии напоминает процесс обработки сигналов нейронами мозга, но аналогия с мозгом не слишком удачна.

Наиболее сложные формы машинного обучения предполагают глубокое обучение, или построение моделей нейронных сетей, имеющих множество уровней функций и переменных, предсказывающих результаты. В таких моделях могут быть тысячи функций, которые обеспечиваются более быстрой работой современных компьютерных архитектур. В отличие от более ранних форм статистического анализа, каждая функция модели глубокого обучения, как правило, мало что значит для человека. В связи с этим модели очень трудно или невозможно интерпретировать. В опросе Deloitte 34 % компаний использовали технологии глубокого обучения.

Модели глубокого обучения прогнозируют и классифицируют результаты с применением техники обратного распространения ошибки [13] . Именно эта технология ИИ стоит за целым рядом недавних прорывов – от победы над человеком при игре в го до классификации изображений в интернете. Отцом глубокого обучения часто называют Джеффри Хинтона из Университета Торонто и компании Google – и отчасти как раз из-за ранней работы над техникой обратного распространения ошибки.

13

James Somers, "Is AI Riding a One-Trick Pony?" MIT Technology Review, September 29, 2017, https://www.technologyreview.com/s/608911/is-ai-riding-a-one-trick-pony/.

В машинном обучении задействуется более сотни возможных алгоритмов, и большинство из них весьма причудливы. Спектр этих алгоритмов весьма широк и охватывает все – от повышения градиента (метода построения моделей, которые устраняют ошибки предыдущих моделей, тем самым повышая их способность к прогнозированию и классификации) до случайных лесов (моделей, которые представляют собой ансамбль моделей

дерева принятия решений). Все чаще программное обеспечение (включая DataRobot, SAS и AutoML от Google) позволяет автоматизировать построение моделей машинного обучения, в ходе которого происходит апробация различных алгоритмов с целью выявить наиболее удачный [14] . Как только обнаруживается лучшая модель для прогнозирования или классификации тренировочных данных, ее используют для прогнозирования и классификации новых данных (иногда это называют скорингом).

14

Mathew Mayo, "The Current State of Automated Machine Learning," KDNuggets blog post, January 25, 2017, https://www.kdnuggets.com/2017/01/current-state-automated-machine-learning.html.

Однако важен не только используемый алгоритм, но и принцип обучения создаваемых моделей. Модели обучения с учителем (на сегодняшний день наиболее распространенные в бизнесе) учатся на основе набора тренировочных данных с маркированным результатом. Например, модель машинного обучения, которая пытается предсказать мошенничество в банке, необходимо учить на системе, где мошенничество в некоторых случаях было однозначно установлено. Это непросто, поскольку частота мошенничества может составлять 1 случай на 100 000, и порой эту проблему называют проблемой несбалансированности классов.

Обучение с учителем очень похоже на традиционный аналитический метод регрессионного анализа, который используется в модели оценки. Цель регрессионного анализа заключается в том, чтобы создать модель, предсказывающую известный результат, используя набор входных переменных с известными значениями, которые могут быть связаны с этим результатом. Когда модель разработана, ее можно использовать для предсказания неизвестного результата на основе известных значений тех же входных переменных. Например, можно разработать регрессионную модель, предсказывающую вероятность заболевания диабетом в зависимости от возраста пациента, уровня его физической активности, количества потребляемых калорий и индекса массы тела. При разработке этой модели мы будем ориентироваться на пациентов, которые уже заболели или не заболели диабетом, используя все доступные данные для построения регрессионной модели. Обнаружив хорошую предсказательную регрессионную модель, мы сможем использовать ее на новом наборе данных, чтобы предсказать неизвестный результат – вероятность заболевания диабетом в зависимости от определенных значений входных переменных. Это называется скорингом (как в регрессионном анализе, так и в машинном обучении).

Регрессионный процесс напоминает машинное обучение с учителем, но имеет ряд особенностей:

 В машинном обучении данные, используемые для разработки (тренировки) модели, называются тренировочными данными и могут представлять собой подмножество данных, необходимых исключительно для тренировки системы.

 В машинном обучении тренировочная модель часто утверждается при помощи другого подмножества данных, для которого известен подлежащий предсказанию результат.

 В регрессионном анализе может и не возникнуть желание использовать модель для предсказания неизвестных результатов, тогда как в машинном обучении наличие этого желания подразумевается.

 В машинном обучении может использоваться множество различных алгоритмов, которые не ограничиваются простым регрессионным анализом.

Модели обучения без учителя, как правило, более сложны в разработке. Они распознают закономерности в данных, которые не маркированы заранее и для которых неизвестен результат. Третий способ обучения, обучение с подкреплением, предполагает, что система машинного обучения имеет определенную цель и каждое продвижение к этой цели вознаграждается. Такой способ весьма полезен в играх, однако он также требует огромного объема данных (и из-за этого порой теряет практичность) [15] . Важно отметить, что модели машинного обучения с учителем обычно не учатся непрерывно: они учатся на основе набора тренировочных данных, а затем продолжают использовать ту же модель, если только не задействуется новый набор тренировочных данных, на основе которого обучаются новые модели.

15

Alex Irpan, "Deep Reinforcement Learning Doesn't Work Yet," Sorta Insightful blog post, February 14, 2018, https://www.alexirpan.com/2018/02/14/rl-hard.html.

Поделиться с друзьями: