Путь к #DataScience или #MachineLearning интервью менее чем за 2 месяца.
"Что вы имеете в виду под #MachineLearning и #DataScience?"
Боюсь, что сразу после ответа на этот вопрос интервьюеры могут не спросить вас: «Спасибо, что вы здесь!».
Конечная цель этого блога - познакомить вас с ресурсами для самообучения #DataScience и #MachineLearning, а также с ограничениями по времени. Это не только поможет вам сформулировать ваше собственное конкретное определение #MachineLearning и #DataScience, но также поможет вам почувствовать себя достаточно уверенно, чтобы участвовать в любом собеседовании #DataScience и #MachineLearnign.
Не отнимая много времени, приступим…
ВНИМАНИЕ: если вы «думаете», что у вас нет потенциала к обучению, вы никогда не сможете учиться.
Прежде чем двигаться дальше, я хотел бы предложить вам начать решать одну или две головоломки ежедневно отсюда (https://www.geeksforgeeks.org/puzzles/).
Стратегия: прочитайте одну головоломку утром и дайте своему мозгу время подумать над ее решением в течение дня. Постучите плечом, если решите самостоятельно или видите решение (я) перед сном.
Делайте это ежедневно, пока не решите первые 30 головоломок. Это должно быть обязательство параллельно достижению следующих целей, я лично это сделал.
Решение головоломок поможет вашему мозгу научиться «мыслить нестандартно». Начни решать прямо сейчас!
Блог разделен на четыре раздела.
- Раздел 1: Предварительные условия
- Раздел 2: Какие темы нам нужно рассмотреть, прежде чем приступить к изучению реальных #DS и #ML.
- Раздел 3: Идеальное руководство по #DataScience и #MachineLearning.
- Раздел 4: Два основных проекта, которые вы можете добавить в свое резюме.
Раздел 1. Предварительные требования (0 минут)
Высокая самомотивация, высокая выносливость и высокая приверженность.
Само собой разумеется, «берегитесь обезвоживания !!!» :)
Раздел 2: темы для обсуждения (5 дней)
1. Python для науки о данных (2 дня):
(а.) https://www.coursera.org/learn/python-for-applied-data-science-ai (5 часов)
Пройдите аудит вышеупомянутого курса и посмотрите все видео. Здесь вы можете найти задания:
Https://github.com/ivrschool/coursera_IBM_Datascience/tree/master/Python%20for%20DS
Пожалуйста, перепишите коды в записной книжке самостоятельно. Для этого используйте Google Collab.
(б.) Несколько важных трюков с питоном: (30 минут)
I. Составление списка: https://youtu.be/AhSvKGTh28Q
II. Генератор: https://youtu.be/bD05uGo_sVI
Я предлагаю подписаться на эти два канала. Это поможет вам отображать важные ленты с трюками Python на YouTube. Просмотр этих каналов не только поможет вам лучше понять Python, но и поможет вам подготовиться к «вопросам собеседования по Python».
(c.) https://www.hackerrank.com/domains/python (15 часов)
Решайте только вопросы легкого и среднего уровня.
2. Базовая вероятность (1 день):
I. https://seeing-theory.brown.edu/ (3 часа)
II. Https://www.hitbullseye.com/Probability-Examples.php (1 час)
III. войдите в https://prepare.prepleaf.com/ (перейдите к практике- ›квант-› вероятность и комбинаторы) (5 часов)
Решите каждый из вопросов.
3. Статистика (2 дня)
I. https://youtu.be/hjZJIVWHnPE (30 часов)
Воспроизвести видео в 1,5 раза.
Также делайте заметки параллельно с просмотром этого видео. Дайте себе время, чтобы понять теорию. Вам не нужно больше акцентировать внимание на доказательстве формул. Я бы посоветовал просто принять то, чему учат, и двигаться дальше. Вы все равно узнаете об этом в будущем, когда это потребуется.
Примечание. В некоторой части видео отсутствует звук. Вы можете найти ссылку на эти части в описании видео.
Раздел 3: # DataScience и # MachineLearning
Ура!!!
Теперь вы можете изучить #DS и # ML… ..
#DataScience (33 дня)
I. Https://www.coursera.org/learn/what-is-datascience (1 час)
Вам нужно охватить только видео первой недели и пропустить остальные разделы.
II. Https://www.coursera.org/learn/data-science-methodology (2 часа)
Проверьте это и просто послушайте все видео с 1-й по 3-ю неделю. Не нужно делать здесь задания и викторины.
III. Https://www.coursera.org/learn/python-for-data-visualization (24 часа)
Пройдите аудит этого курса и охватите с 1-й по 3-ю неделю. Вы можете пропустить раздел «Визуализация геопространственных данных» с 3-й недели. Только видео смотрите. Здесь вы можете найти все необходимые задания:
Https://github.com/ivrschool/coursera_IBM_Datascience/tree/master/Data%20Visualization
Пожалуйста, перепишите коды в записной книжке самостоятельно. Для этого используйте Google Collab.
IV. Https://www.coursera.org/learn/data-analysis-with-python (48 часов)
Проведите аудит курса и охватите с 1-й по 5-ю неделю. Все необходимые задания вы можете найти здесь:
Https://github.com/ivrschool/coursera_IBM_Datascience/tree/master/Data%20Analysis%20with%20Python
Пожалуйста, перепишите коды в записной книжке самостоятельно. Для этого используйте Google Collab.
В. Https://www.coursera.org/learn/sql-data-science (8 часов)
Проведите аудит курса и охватите только 1-ю и 2-ю неделю. Я бы посоветовал сделать заметки для справок в будущем. Здесь вы можете найти все необходимые задания:
Https://github.com/ivrschool/coursera_IBM_Datascience/tree/master/SQL
Пожалуйста, перепишите коды в записной книжке самостоятельно. Для этого используйте Google Collab.
Прежде чем двигаться дальше, ответьте на простой и средний вопросы отсюда: https://www.hackerrank.com/domains/sql
VI. Https://www.coursera.org/learn/machine-learning-with-python (96 часов)
Аудит курса. Смотрите все видео и не пропускайте ни одного задания. Здесь вы можете найти все задания:
Https://github.com/ivrschool/coursera_IBM_Datascience/tree/master/Machine%20Learning
Пожалуйста, перепишите коды в записной книжке самостоятельно. Для этого используйте Google Collab.
D.) Раздел 4:
I. Редакция (7 дней)
Прежде чем переходить и работать над каким-либо проектом или проектами, я бы посоветовал пересмотреть все части материала, которые вы уже узнали. Посмотрите все видео по порядку и один раз просмотрите свои заметки и задания. Если возможно, лучше дважды.
II. Проекты (16 дней):
Следующие два проекта помогут вам использовать почти все ваши концепции, которые вы уже изучили, для применения в реальном сценарии.
Эти записные книжки хорошо документированы и помогут вам понять, как настоящий специалист по данным думает и подходит к данной бизнес-проблеме.
- Прогноз одобрения ссуды (9 дней):
Https://github.com/limchiahooi/loan-approval-prediction
Примечание. Вы можете пропустить раздел XGBoost.
2. Приложение автоматически определяет виды цветов на фотографиях (7 дней):
E.) Бонус: слова мудрости (1 мин.)
Престижность !!!
Пожалуйста, мягко похлопайте себя по плечу и поздравьте себя с тем, что зашли так далеко. Теперь вы знаете весь набор необходимых методов и знаний, чтобы уверенно пройти собеседование #DataScience или #MachineLearning.
Пожалуйста, напишите мне по электронной почте ([email protected]), если вам понадобится помощь. Я бы хотел лично встретиться с вами, чтобы увидеть эту широкую улыбку на вашем лице.
Всего наилучшего !!!