Прошло около 3 лет с тех пор, как я начал работать с машинным обучением и смежными областями. Увидев мои работы и публикации о семинарах по машинному обучению, многие люди спрашивают: «Мне нравится учиться или работать с машинным обучением, но я не знаю, с чего начать?». Поэтому я пишу это, чтобы помочь тем, кто интересуется машинным обучением. В этом посте я просто даю маршрутную карту того, как я организую области машинного обучения для создания учебного плана.

  • Поймите концепцию машинного обучения с точки зрения непрофессионала. Понимание машинного обучения как подобласти искусственного интеллекта, его связи с наукой о данных и аналитикой больших данных.

Машинное обучение — это не что иное, как повышение производительности(P) алгоритма выполнения задачи(T) посредством опыта(E). «Учиться на собственном опыте»

  • Быть знакомым с языками программирования, совместимыми с машинным обучением, такими как Python, R, Matlab… Я предпочитаю Python, потому что использую его. Убедитесь, что вы узнали из самой установки, как управлять пакетами и средами программирования, базовыми конструкциями, такими как типы данных, операторы и т. д., управляющими структурами, контейнерами или абстрактными структурами данных, функциями, объектно-ориентированным программированием. Кроме того, попробуйте использовать некоторые фреймворки, такие как Anaconda, которые помогут вам правильно управлять кодом и пакетами. Кроме того, он предоставляет различные мощные утилиты для кодирования, такие как spyder, jupyter Notebook и т. д.
  • Ознакомьтесь и имейте некоторый опыт работы с базовыми пакетами и пакетами машинного обучения. В пакетах Python, таких как Numpy, Pandas, OpenCV, matplotlib, sklearn, необходимо изучить.
  • Если Машинное обучение — это ракета, то данные — ее топливо, то следующим этапом приручения машинного обучения является четкое понимание данных, типов данных, способов сбора и организации данных. Наборы данных в файлах CSV и их обработка с помощью pandas. Как получить наборы данных онлайн — www.kaggle.com
  • Разработка функций – это важный этап машинного обучения. Тут надо понимать, какие особенности? Понимание уменьшения размерности, извлечения признаков и выбора признаков. https://scikit-learn.org/stable/modules/feature_selection.html. Концепции PCA, LDA и то, как это можно сделать с помощью sklearn.
  • Предварительная обработка — еще один важный этап. В зависимости от характера и особенностей данных существуют различные методы предварительной обработки. Вы можете перейти по этой ссылке https://scikit-learn.org/stable/modules/preprocessing.html для изучения теории и реализации.

Каждый алгоритм машинного обучения работает хорошо только тогда, когда он изучен правильно. Обучение — это процесс, помогающий алгоритму обучаться. После обучения алгоритмы превратились в модель, которую можно использовать для прогнозирования и проверки точности.

  • Далее следует основной и трудоемкий этап. Вам нужно понять, что такое машинное обучение? Что такое обучение с учителем, обучение без учителя и обучение с подкреплением? Общее понимание классификации, регрессии, кластеризации и т. д. Как работает классификация с SVM, KNN, NaiveBayes и т. д. Работа с различными алгоритмами кластеризации, такими как K-Means, K-Medoid и т. д. Прогнозирование с использованием методов регрессии, таких как линейная регрессия, логистическая регрессия и т. д.
  • После полного понимания описанного выше метода вы можете реализовать каждый из этих алгоритмов с помощью sklearn. https://scikit-learn.org/stable/. обратитесь к этому сайту для примеров и использования.
  • Тестирование — это один из видов оценки, но есть несколько методов оценки обученной модели, таких как точность, полнота и т. д. Вы также можете визуализировать эти матрицы оценки для получения четкой картины.

Вы можете собрать все эти вещи вместе и решить проблемы ML начального уровня. Вряд ли потребуется 20 часов, чтобы скрыть это.

Всем лучших ребят!

Для получения разъяснений и помощи вы можете связаться со мной по адресу [email protected]