Итак, вы изучили Python, выполнили несколько фиктивных проектов, чтобы повысить свою уверенность, и теперь готовы взяться за реальные проекты.

Многим начинающим аналитикам данных и специалистам по данным трудно столкнуться с реальным проектом данных. Проекты в реальном времени — это не что иное, как контролируемые наборы данных, доступные в Интернете. Реальные проекты сопряжены с реальными проблемами, связанными с данными. Эти проблемы могут быть очень специфическими в зависимости от проблемы.

В этом посте я расскажу о 5 вещах, которые вы можете сделать, чтобы добиться успеха в своем первом проекте. Обратите внимание, что это полностью исходит из моего опыта.

  1. Правильные вопросы для решения правильной бизнес-проблемы

Первое, что нам нужно понять о любом сценарии решения проблемы, это:

Какую бизнес-задачу мы решаем?

Нам нужно сначала определить бизнес-проблему, прежде чем переходить к решению любой другой проблемы. Все направление проекта будет зависеть от того, как мы определяем бизнес-проблему. Теперь, чтобы определить бизнес-проблему, нам нужно задать правильные вопросы.

Какими могут быть эти правильные вопросы?

Это может быть что угодно, что поможет вам и вашей команде лучше понять природу проблемы. Например, возьмем сценарий:

Если заинтересованное лицо приходит и говорит вам, что хочет вас, то его прибыль снижается, и они хотят, чтобы вы их проанализировали. Это очень расплывчатое и широкое определение проблемы. Затем вам нужно будет задать вопросы, которые определят направление вашего анализа. Вопросы типа:

  • Снижается ли ваша прибыль из-за падения продаж? если да, то посмотрите, почему продажи упали. Изменено определение проблемы
  • Ваша прибыль упала из-за того, что вы уступаете бизнес новому конкуренту? если да, то проведите анализ конкурентов. Определение проблемы снова изменилось

2. Ваше оружие — способность к исследованиям

Знание предметной области имеет первостепенное значение для специалиста по данным. Но для начинающих специалистов по данным невозможно работать в разных областях или отраслях. Следовательно, для вас становится обязательным получать эти знания из внешних источников. Вот где проявляется ваше умение исследовать.

Исследование означает не только выходить и задавать людям вопросы. Исследования также могут проводиться:

  • читая книгу
  • чтение журналов/исследовательских работ
  • чтение блогов и т.д. и т.п.

Идея состоит в том, чтобы внести информацию о домене, и не имеет значения, получена ли она путем опроса людей или из сторонних ресурсов.

3. ОБЩАЙТЕСЬ!!

Самый недооцененный навык, который вы можете развить в любом проекте по науке о данных, — это «Общение». Очень немногие думают, что проекты AI/ML связаны только с программированием. Ну, тут люди ошибаются. Эти проекты представляют собой экосистему внутри себя, и, пожалуйста, помните, что никакие проекты AI/ML не выполняются отдельными лицами. Это групповое усилие и групповая деятельность. Поскольку многие умы работают вместе, потребность в общении становится более важной. Общение имеет много значений. Общение может означать:

  • идеи мозгового штурма
  • задавать вопросы
  • обмен информацией с помощью визуализаций и т. д.

Чем больше вы будете общаться, тем больше вы узнаете. Период.

Синдром самозванца очень распространен среди специалистов по искусственному интеллекту и машинному обучению, потому что нужно многому научиться, и всегда кажется, что другой человек знает больше, чем мы. Но мы никогда не проверяем и не пытаемся заполнить этот пробел в знаниях, потому что мы не общаемся. Когда мы общаемся и спрашиваем, это открывает нам различные двери и измерения для изучения, а наука о данных — это изучение и обучение.

4. Научитесь управлять своим временем

Несмотря на то, что это коллективная работа, в проекте всегда нужно сделать так много работы, потому что время — бесценный ресурс. Тогда становится необходимым, чтобы мы управляли временем, и мы управляли им хорошо. В проектах с открытым исходным кодом или совместных проектах вы всегда будете чувствовать потребность делать все и учиться сразу. Не попадайтесь в эту ловушку. Держите цель узнать что-то конкретное из каждого проекта. Это поможет вам лучше управлять своим временем. Вы можете лучше управлять своим временем, распределяя его на различные действия на разных этапах проекта. Что я имею в виду под этим:

  • Если вы находитесь на стадии инициации проекта, посвятите больше времени исследованиям и инструментам обучения, которые будут использоваться в проекте.
  • Когда вы переходите к этапу сбора данных, на основе вашего участия вы можете выделить время для изучения этого навыка или, если вы не участвуете, возможно, выделить больше времени для изучения следующей вехи проекта. и т. д.

Пожалуйста, не тратьте большую часть своего времени на кодирование и не тратьте все доступные часы на выполнение только одного проекта. Работайте как минимум над двумя проектами одновременно и посмотрите, насколько хорошо вы станете расставлять приоритеты.

5. И, наконец, научитесь документировать (все)

Лично я никогда не любил ничего документировать. Но со временем и особенно после того, как я перешел на роль «программиста», я понял, насколько важно документировать все, что вы делаете в проекте. Начиная с комментирования фрагмента кода и заканчивая записью анализа. Я не могу не подчеркнуть, насколько это важно. Но вы не должны превращаться в ночную сенсацию письма. Одного шага за раз более чем достаточно. Может быть, начните с записи каждого небольшого анализа, который вы сделали за день. Поначалу это покажется очень сложной задачей, но если разбить ее на более мелкие части, получится очень весело. Может быть, вы можете ответить на эти вопросы для начала:

  • Кому делали анализ?
  • На какой вопрос пытался ответить анализ?
  • Какое влияние на бизнес окажет анализ?
  • Каковы были первоначальные предположения?
  • Как вы подошли к этому? Так далее и тому подобное.

Как только вы начнете записывать и документировать свои материалы, это автоматически отразится на различных аспектах вашей доставки, таких как кодирование — вы начнете писать более качественные и эффективные коды, поскольку теперь понимаете последствия своего анализа. Ваши навыки презентации улучшатся, поскольку теперь вы знаете свою целевую аудиторию. Вы начнете составлять правильные диаграммы, потому что теперь знаете, что нужно представить.

Первые несколько проектов всегда кажутся непосильными, и именно в этих начальных проектах кривая обучения будет очень крутой. Сделать большинство из них. Не уклоняйтесь от совершения ошибок, но и не повторяйте одну и ту же ошибку. Это будет означать только то, что вы не учитесь. Всегда продолжайте учиться!

Я люблю писать обо всем, что связано с данными. Если вы хотите, чтобы я написал на определенную тему, я определенно буду рад это сделать.

До тех пор,

Ваше здоровье!