Реалистичное понимание того, что такое ИИ, а что нет, имеет решающее значение как для инвесторов, так и для потребителей в мире, наполненном шумихой.

Вы когда-нибудь смотрели фильм, в котором кажется, что перед героем стоят невероятные шансы, но какая-то неожиданная удача или магия приходит с левого поля и спасает положение? В литературных терминах это называется Deus ex machina, «бог в машине». В древнегреческом театре настоящий подъемный кран (машина) опускал актера, играющего бога (Деуса), на сцену, чтобы положить конец конфликту в последний момент. ¹

К сожалению, многие стартапы (и солидные компании тоже!) используют термины «искусственный интеллект» (ИИ) и «машинное обучение» (МО) в качестве Deus ex machina, чтобы сделать отрывочные основы и технологии передовыми. и достоин вложений. В то время как ИИ при правильном использовании может повлиять практически на все уголки каждого рынка, понимание ограничений ИИ может помочь отделить ажиотаж от преобразований.

Что такое искусственный интеллект на самом деле?

На практике искусственный интеллект (ИИ) не относится к одной конкретной технологии — ИИ — это модное маркетинговое слово. Волшебства нет, и компьютеры с программным обеспечением ИИ не стали разумными. Фильмы и популярная культура нарисовали широкое, научно-фантастическое видение ИИ, как и компании, преувеличивающие возможности своего программного обеспечения. По состоянию на 2020 год термин ИИ, используемый честно, относится к практическому применению нескольких семейств статистических алгоритмов.

Традиционно люди программируют компьютеры для выполнения повторяющихся задач. Мы пишем строки кода с мельчайшими подробностями, которые точно сообщают аппаратному обеспечению компьютера, что делать. Компьютеры на удивление тупые; они по сути не знают, что им следует делать в данной ситуации, если только программист явно не написал код для ее обработки. Как правило, люди гораздо лучше справляются с задачами, требующими творчества и спонтанности. Конечно, компьютеры выполняют многие задачи лучше, чем люди, но это не делает их автоматически «искусственно разумными». А поскольку люди, которые могут ошибаться, пишут код, который запускает компьютер, практически все программное обеспечение также подвержено ошибкам и подвержено ошибкам. Хотя люди могли писать строки кода для решения огромных задач в каждой области, у нас есть практические ограничения в том, что мы можем описать.

Представьте себе программирование компьютера для определения того, является ли ввод, такой как «голубая сойка», птицей или нет — простая задача, если у компьютера есть список названий птиц. Было бы тривиально проверить, что «голубая сойка» есть в списке, а «бейсбол» — нет. Соответственно, относительно просто написать программное обеспечение, которое может распознавать свойства птиц. Если бы программе была передана электронная таблица данных о конкретном животном, было бы несложно проверить, соответствуют ли способности животного способностям птицы.

В отличие от этого, представьте себе программирование компьютера, чтобы он распознавал, есть ли на фотографии птица. К сожалению, это не так просто, как спросить: «Это животное с крыльями и клювом?» Анализ изображения — это отдельная история. Изображение состоит из тысяч (иногда миллионов или миллиардов) крошечных квадратиков (пикселей), каждому из которых присвоен свой цвет. Учитывая эти данные, как можно написать алгоритм, учитывающий, как цвета каждого пикселя, расположенные в определенном порядке, создают птицу? Как меняется алгоритм при фотосъемке при разном освещении? А как насчет птицы, снятой с разных ракурсов? Как насчет мультяшной птицы и настоящей? Как насчет того, чтобы не путать с другими объектами, такими как самолет, который также может иметь трубчатое тело и крылья? Уровень сложности, связанный с этим, казалось бы, «простым» анализом фотографии, настолько велик, что, как правило, мы как биологический вид не в состоянии написать достаточно строк кода, чтобы в достаточной мере решить эту проблему. Так куда же мы пойдем отсюда?

Вспомните детство: как вы узнали, что такое птица? Наверняка ваши родители не пытались описать вам птицу с точки зрения пикселей, оттенков, углов или кривизны. Вместо этого вы видели много птиц, и, в конце концов, путем повторения ваши впечатления усреднялись, чтобы дать вам интуитивное понимание того, что делает птицу похожей на птицу. Теперь вы можете легко распознать птицу, даже если вы ее раньше не видели. Конечно, можно ошибочно принять животное, например летучую мышь, за птицу. Однако в большинстве случаев аппроксимации вашего мозга достаточно.

Что, если бы мы могли научить машину учиться таким же образом, используя повторения и приближения? Как оказалось, мы можем, и этот процесс метко назван машинное обучение.

Скорее всего, вы сами неосознанно использовали базовые методы машинного обучения. Вы когда-нибудь на работе или в школе использовали набор точек и выполняли линейную регрессию, чтобы найти линию тренда («линию наилучшего соответствия»)?

Подобно тому, как более сложное машинное обучение позволяет создавать беспилотные автомобили, линейная регрессия по своей сути использует статистические алгоритмы и приближения для «подбора» модели (в данном случае линии наилучшего соответствия). к данным. Затем созданную модель можно использовать для прогнозирования. Теперь в современном машинном обучении используются гораздо более «причудливые» алгоритмы повышенной сложности, которые обычно значительно превосходят производительность линейной регрессии. Возможно, вы слышали о некоторых из них: глубокое обучение, нейронные сети, случайные леса, наивный байесовский алгоритм и множество других.

Здесь нет никакой магии — только статистика. На практике термины «искусственный интеллект», «модели машинного обучения» и «алгоритмы статистического «обучения» относятся к одному и тому же. Эти модели не обладают разумом, и они не дают компьютеру внезапной способности думать и чувствовать самостоятельно, как человек. При этом на практике статистические алгоритмы все еще могут казаться волшебными; многие приложения машинного обучения обладают революционными возможностями.

Когда термин «искусственный интеллект» правильно используется на практике специалистами по данным, он относится к осторожному использованию несколько передовых статистических алгоритмов для создания модели, выводящей вывод или прогноз. Само собой разумеется, что это определение невключает в себя большие объемы ручного труда, оффшорного труда или простой анализ трендовых линий. Остерегайтесь тех, кто добавляет мистицизма в свои презентации, прикрывая свой простой продукт термином ИИ.

Какие проблемы может решить машинное обучение?

Машинное обучение, конечно, не безупречно, но оно действительно превосходно работает в широком и постоянно расширяющемся спектре областей. Вот лишь небольшой пример многочисленных новаторских вариантов использования ML:

Помимо приведенных выше примеров, стартапы, успешно использующие машинное обучение, уже радикально трансформируют рынки, вытесняя с ног устоявшихся игроков.

Каковы проблемы машинного обучения?

Данные

Модель машинного обучения хороша настолько, насколько хороши данные, которые она предоставляет. Действует старая пословица: мусор на входе, мусор на выходе. Во всей отрасли (и действительно из личного опыта автора) 50% или более времени, которое специалист по данным тратит на работу, может быть потрачено на сбор, обработку и очистку множества строк и столбцов данных, которые будут переданы в алгоритм ML. . Кроме того, разработка функций (со столбцами данных, называемых функциями на жаргоне науки о данных) с использованием экспертных знаний в предметной области для получения дополнительных функций из существующих требует времени и значительно повышает производительность модели машинного обучения. Если все вышеперечисленное сделано неправильно, модель может работать неоптимально или вообще не работать.

Кроме того, достаточное количество данных имеет первостепенное значение. Часто для того, чтобы алгоритмы машинного обучения были адекватно производительными и обобщаемыми, требуются большие объемы данных, что способствует повышению важности «больших данных». Делаются успехи в улучшении машинного обучения с меньшими наборами данных, и фирмы, которые делают это успешно, могут иметь сильное конкурентное преимущество.

Применимость к реальному миру

Не все модели машинного обучения, хорошо работающие в лаборатории, будут хорошо работать и в реальной жизни. Многие типы недостатков модели, такие как переоснащение, могут проявляться неочевидным образом, и для их устранения может потребоваться серьезное исследование. Чувствительные и сопряженные с высоким риском приложения ML должны использовать строгие меры контроля качества и тщательное тестирование, чтобы гарантировать, что реальная производительность соответствует желаемой.

Странное поведение и атаки

Модели машинного обучения думают не так, как люди. Даже нейронные сети, которые, похоже, обрабатывают информацию подобно тому, как это делает наш мозг (и отчасти это так), не рассматривают, скажем, изображение птицы так, как это делаем мы. Некоторые довольно странные хаки могут обмануть алгоритмы машинного обучения. Обмануть алгоритм распознавания лиц в лаборатории может показаться безобидным, но обмануть беспилотный автомобиль, заставив его думать, что знак «стоп — это знак ограничения скорости» и создать потенциально смертельную аварию, определенно менее опасно.

Интерпретируемость

В традиционном программировании баг, неправильное поведение или ошибку почти всегда можно проследить до ошибочных строк кода. Это не всегда так в машинном обучении. Некоторые семейства моделей машинного обучения представляют собой нечто вроде черного ящика. В то время как мы понимаем математику, стоящую за статистическими инновациями, такими как глубокое обучение, взаимосвязи между иногда миллиардами и триллионами точек принятия решений, которые их составляют, людям практически невозможно полностью понять с помощью интуиции. С другой стороны, простые модели, такие как деревья решений, гораздо более интерпретируемы, с формулируемыми точками принятия решений (например, когда признак y > 5 и признак x ‹ 7, транзакция является мошеннической). Часто, но не всегда, более «черные ящики» моделей гораздо лучше подходят для решения сложных задач, таких как беспилотные автомобили. К сожалению, если бы эта машина разбилась, было бы практически невозможно найти виновный эквивалент строки кода в модели глубокого обучения.

В традиционном программировании программа может быть «правильной» только в 70% случаев, но ошибки объяснимы. В машинном обучении модель может быть правильной в 99,9% случаев, но может быть сложно объяснить, почему она терпит неудачу, когда это происходит. Выбор между этими сценариями не всегда очевиден, и его следует тщательно взвешивать при выборе применения машинного обучения для решения проблемы.

Чего мы не знаем

Как и в случае с интерпретируемостью модели, существуют и другие аспекты машинного обучения, которые нам неизвестны. Например, элементы случайности, введенные при обучении модели, могут иметь серьезные последствия для того, как модель работает в реальной жизни. Мы только недавно сделали некоторые из этих открытий, и, вероятно, мы еще не знаем о технологии, которую используем.

Этичное использование

Обеспечение надлежащего и этичного использования AI/ML, несомненно, останется глобальной проблемой на протяжении всей нашей жизни и в будущем. Как и в случае с тонким балансом между достижениями в области ядерной энергетики и ядерного оружия (а также биотехнологии и биологического оружия и т. д.), масштабные улучшения качества жизни, которые принесет ИИ, также могут открыть холодные новые эры государств наблюдения, массового угнетения, и авторитарных режимов. Более того, предвзятость в моделях машинного обучения может проявляться не только как статистическая погрешность, но и как социальная погрешность.

Хоть это и банально, но важно помнить, что многие из самых значимых изобретений в истории способны оказывать широкомасштабное влияние как к лучшему , так и к худшему. В конце концов, ежегодно на дорогах гибнет более 1 миллиона человек², но совершенно очевидно, что миру лучше с моторизованным транспортом, чем без него. Точно так же, как у нас есть законы о ремнях безопасности и минимальные стандарты безопасности для автомобилей, становится критически важным рассматривать ответственное использование ИИ как жизненно важное отличие при оценке фирмы, использующей ИИ, как инвестора или как потребителя. Правильный выбор может оказаться чрезвычайно прибыльным.

ИИ обладает исключительным потенциалом изменить мир, и честные, амбициозные игроки в этой сфере заслуживают значительных инвестиций (как и их инвесторы, получающие значительную прибыль). Очень важно иметь правильную поддержку, чтобы проанализировать и понять, является ли потенциальный клиент «настоящим» или просто накачивает некачественную подачу, спуская модное словечко с крана из пословицы.

[1] https://www.merriam-webster.com/dictionary/deus%20ex%20machina

[2] https://www.cdc.gov/injury/features/global-road-safety/index.html