Растущий интерес к фондовому рынку вызвал ажиотаж во многих секторах, и мы можем воспользоваться этим, используя науку о данных. В этом посте мы покажем, как извлекать данные о настроениях в реальном времени из Stocktwits, хорошо известной платформы для биржевых трейдеров. Такие ценные данные помогают нам повысить точность алгоритмов прогнозирования на основе машинного обучения.

Сначала загрузим модули. Мы будем использовать Selenium для удаления веб-страниц и Beautiful Soup, чтобы получить простой читаемый исходный код.

Затем, если у вас его еще нет, загрузите драйвер Chrome (по моему опыту, он быстрее, чем Firefox, но вы также можете попробовать!) . Затем загрузите драйвер с помощью python, он откроет окно Chrome:

Теперь давайте выберем биржевой тикер, загрузим содержимое страницы и получим читаемый источник. Здесь сложнее всего было выяснить структурные компоненты дизайна Stocktwits и просто получить то, что нам нужно, например, строку 14.

Ниже изображение элементов данных, которые нам нужно собрать. Это процентное изменение цены, настроения и объема сообщений.

Обратите внимание, что знаки процента указаны направлением стрелок. Мы придумали следующий трюк, чтобы получить эти знаки:

Наконец, мы получаем точки данных, умноженные на их соответствующий знак, и закрываем драйвер.

В этом случае мы получаем: data = [2.58, -0.2, -4.6], c.f, рис. 1. Весь исходный код доступен на нашем GitHub.

В следующем посте мы покажем расширение и интеграцию этого метода утилизации в алгоритм, основанный на глубоком обучении, для прогнозирования рынка.

Если вы узнали что-то полезное, пожалуйста, хлопайте в ладоши !. Это покажет мне вашу признательность за эту работу и побудит меня добавить больше контента. Спасибо!.