Сегодня я предлагаю поговорить о 5 вещах, которые каждый (хороший) аналитик делает в рамках любого своего проекта. ⬇️

1. Определение задач

Когда мы делаем аналитику для бизнеса, чаще всего перед нами стоят конкретные прикладные задачи: найти причину события, спрогнозировать поведение потребителей, предложить план действий компании.

Например, нам нужно оценить успех последнего обновления мобильного приложения. Что вообще такое «успех»? В чем он измеряется? По каким показателям он рассчитывается? Важно еще до начала работы понять, какова наша конечная цель и на какие вопросы нам придется ответить, чтобы ее достичь.

2. Сбор данных

С вопросами определились — теперь нужно разобраться, какие данные содержат ответы на них. Бывает, что у аналитика вся необходимая информация сразу на руках. А бывает, что нужно придумать, куда и как его выгрузить.

Иногда приходится буквально «собирать» данные: например, провести серию опросов. Здесь главное помнить о репрезентативности выборки.

3. Предварительная обработка

Во-первых, все наши csv-, xls- и txt-файлы с бесконечными пестрыми таблицами нужно собрать в единую систему в рамках той среды, в которой мы собираемся работать. Скажем, в кадрах данных Pandas.

Во-вторых, вам нужно навести порядок: избавиться от выбросов, шума и дубликатов, использовать специальные инструменты для обработки пропущенных значений.

В информатике есть известный принцип: «Мусор на входе, мусор на выходе» — некачественные входные данные дают неверный результат, даже если алгоритм работает идеально. Для бизнес-аналитики это всегда связано с потенциальными потерями.

В-третьих, вам необходимо оптимизировать фреймы данных: отфильтровать ненужные параметры, агрегировать похожие функции и упорядочить объекты.

При анализе данных мы обычно имеем дело с множеством различных числовых признаков, значения которых могут различаться на порядок. Например, средний расход топлива на 100 км в литрах и вес автомобиля в килограммах. Поэтому часто возникает необходимость нормализации данных — приведения всех числовых признаков к одному диапазону значений (как правило — от 0 до 1).

4. Анализ

Среди задач, которые решает аналитик данных, можно выделить три большие группы:

● описание имеющихся данных;
● построение моделей и поиск ссылок;
● формирование прогнозов на будущее.

Именно здесь вступают в действие информационные панели, статистические гипотезы, корреляции и другие методы и инструменты бизнес-аналитики. 🙂

5. Интерпретация

И последнее, но не менее важное: осталось понять, насколько результаты анализа отвечают на ваши вопросы из первого абзаца, сформулировать эффективное бизнес-решение и грамотно преподнести свои мысли заказчику.

Прежде чем ты уйдешь:

Если вам нравится читать такие истории и вы хотите поддержать меня, не забудьте похлопать меня в ладоши 👏, подпишитесь на меня ✅ и таким образом получайте все обновления 🔄 о новых публикациях.