Публикации по теме 'statistics'


Основы вероятности для науки о данных
Статистика является основой науки о данных. Хороший Data Scientist должен быть хорошим статистиком. А для статистики ему нужно хорошо знать вероятность. Эта статья предназначена для того, чтобы познакомить вас с вероятностью базового уровня. Вероятность: Что такое вероятность? Проще говоря, это число, обозначающее вероятность возникновения события. Возьмем, к примеру, подбрасывание монеты. Вероятность того, что выпадет решка, равна 50–50, т.е. вероятность выпадения орла при..

Можно ли улучшить множественную линейную регрессию с помощью статистики уровня экземпляра?
Наука о данных , Статистика Можно ли улучшить множественную линейную регрессию с помощью статистики уровня экземпляра? Оценка прочности бетона на сжатие Оглавление: I. Информация о наборе данных II. Загрузка данных III. Практическое руководство по множественной линейной регрессии IV. Улучшение модели множественной линейной регрессии с помощью статистики экземпляров V. Ссылки I. Информация о наборе данных Количество экземпляров 1030 Количество атрибутов 9 Разбивка..

Как бороться с выбросами в шумной популяции?
Определение выбросов может быть простой задачей. С другой стороны, решение о том, что с ними делать, всегда требует более глубокого изучения. Мотивация Данные могут быть зашумленными. Когда у вас небольшая (по отношению к размеру совокупности) случайная выборка совокупности, особенно шумной, создание модели, которая бы хорошо обобщала, может оказаться довольно сложной задачей, а то и невозможным. Представьте, что вы построили простую линейную модель, которая плохо работает с..

Томас Вики из Quantopian на тему «Учитывая разрыв» между статистикой и машинным обучением в ODSC…
Ключевые выводы: Специалистам по данным важно понимать так называемый «разрыв» между статистикой и машинным обучением, а также то, что между ними на самом деле много общего; это просто вопрос того, как вы смотрите на вещи. PyMC3 — очень полезная среда вероятностного программирования для Python. Существует ряд методов, как со стороны машинного обучения, так и со стороны статистики, чтобы преодолеть разрыв. Томас Вики провел всю свою профессиональную карьеру после окончания..

Введение в Kotlin-Statistics
Введение в Kotlin-Statistics Свободные операторы Data Science с Kotlin Последние несколько лет я был заядлым пользователем Kotlin . Но моя склонность к Kotlin обусловлена ​​не просто языковой скукой или рвением к продуктам JetBrains (включая PyCharm, отличную среду разработки Python ). Kotlin - это более прагматичная Scala, или Scala для чайников , как я слышал, как кто-то однажды ее описал. Он уникален тем, что старается не быть таким, делая упор на практичность и трудолюбие,..

Найдите среднее значение набора чисел с помощью JavaScript
Узнайте, что такое Mean, его типы и как его вычислить с помощью JavaScript. Статистика и математика являются двумя важными понятиями в финансах и многих других областях. Необходимость расчета большого количества данных или чисел привела к появлению концепции среднего, медианы и моды. В этой статье я собираюсь объяснить, что такое среднее значение, его типы и как его вычислить с помощью JavaScript. Среднее значение имеет важное значение в математике и статистике. Когда мы говорим о..

5 R-пакетов для обработки PDF-файлов
В этой статье мы представим 5 пакетов для обработки PDF-файлов. 1. pdftools pdftools — один из наиболее широко используемых пакетов R для работы с PDF-файлами. Он позволяет пользователям извлекать текст, шрифты, вложения и метаданные из PDF-документов. Он также поддерживает высококачественный рендеринг PDF-документов в форматы PNG, JPEG, TIFF или в необработанные растровые векторы для дальнейшей обработки в R. 2. табулайзер tabulizer разработан специально для..