Ключевые выводы:

  • Специалистам по данным важно понимать так называемый «разрыв» между статистикой и машинным обучением, а также то, что между ними на самом деле много общего; это просто вопрос того, как вы смотрите на вещи.
  • PyMC3 — очень полезная среда вероятностного программирования для Python.
  • Существует ряд методов, как со стороны машинного обучения, так и со стороны статистики, чтобы преодолеть разрыв.

Томас Вики провел всю свою профессиональную карьеру после окончания аспирантуры в Quantopian, финтех-компании, разрабатывающей байесовские модели для оценки торговых алгоритмов. В своем выступлении на ODSC Europe 2018 Вики начал с комикса ниже.

Слайд авторских прав Томас Вики, доктор философии., ODSC Europe 2018

«Название доклада подразумевает, что пробел действительно существует, и на самом деле это не бесспорный вопрос, и есть довольно много членов сообщества машинного обучения, которым нравится то же самое в сообществе статистики. чувствую, что все это только одно, — сказал Вики. «Есть один комикс, который я считаю довольно забавным, а также в нем есть доля правды. Такое ощущение, что вы стоите прямо сейчас перед толпой, такой как я, и говорите об искусственном интеллекте, что, конечно, звучит потрясающе, но на самом деле это просто машинное обучение, а на самом деле это просто показуха для старой доброй статистики. . Я думаю, что в этом есть доля правды, и определенно существуют очень глубокие связи между машинным обучением и статистикой, но есть также много различий в культурах и истории того, как развивались эти две области, и акцент, который они делали на определенных проблемах, которые они хотели решить. .”

В чем разница между машинным обучением и статистикой? Ответы на этот вопрос различаются так же широко, как и набор инструментов, используемых в этих двух дисциплинах. Хотя у обоих больше общего, чем различий, их культуры и корни, а также язык, который они используют, совершенно разные. Однако в последнее время мы можем наблюдать здоровое перекрестное опыление, когда каждая область начинает перенимать идеи другой. В своем выступлении Вики рассматривает идеи, разработанные двумя дисциплинами, и определяет те из них, которые уже преодолели пропасть, и те, которые все еще основаны на одной из двух областей. Некоторыми примерами таких концепций являются информативные априорные значения, нейронные сети, неопределенность, регуляризация и иерархические модели.

В докладе показано, как объединить эти различные идеи, чтобы предоставить богатый набор инструментов для решения широкого круга задач науки о данных. Для этого Вики определил ряд характеристик для двух главных героев в технической версии сократовского диалога. С одной стороны был «Статистический Рик», который придерживался точки зрения традиционных статистиков, в то время как «Машинное обучение Морти» имел более современную точку зрения современного специалиста по данным. Разговоры звучали правдоподобно для меня, поскольку я играл роль Рика в прошлом из-за моего академического образования в прикладной статистике.

Слайд авторских прав Томас Вики, доктор философии., ODSC Europe 2018

Предложение Вики состоит в том, что между этими двумя группами недостаточно взаимопонимания, даже несмотря на то, что их методы часто дополняют друг друга и могут быть объединены для решения сложных проблем, которые не может решить ни одна из них в одиночку. Баланс разговора поддерживает эту точку зрения, и Рик и Морти работают вместе над решением все более сложных проблем — в данном случае в области количественных финансов на основе алгоритмической торговой платформы его компании. Обсуждение включает способы объединения дисциплин машинного обучения и статистики.

Доктор Вики предоставил примеры кодирования с использованием PyMC3, вероятностной среды программирования для Python, которая включает байесовское моделирование и вероятностное машинное обучение с помощью Theano.

Слайд авторских прав Томас Вики, доктор философии., ODSC Europe 2018

Чтобы глубже погрузиться в взаимосвязь между машинным обучением и статистикой, ознакомьтесь с очень интересным полным докладом доктора Вики с ODSC Europe 2018 ниже.

Оригинальная история здесь

— — — — — — — — — — — — — — — — — —

Читайте другие статьи по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от начального до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг.