Статьи по тематике scikit-learn

Публикации по теме 'scikit-learn'

Показатели производительности для моделей машинного обучения (часть 1: среднеквадратическая ошибка — MSE)

Метрики регрессии с использованием Python, доктор Элвин Анг https://www.alvinang.sg/s/Regression_Metrics_for_ML_Models_R2_and_MSE_by_Dr_Alvin_Ang.ipynb Когда использовать Что? Самые популярные регрессионные метрики MSE измеряет насколько близки прогнозированные значения к истинным значениям (не включает подгонку кривой) Показатель R2 – это показатель того, насколько прогнозируемые значения соответствуют общей тенденции данных. (Goodness-of-Fit)..

Вопросы по теме 'scikit-learn'

AttributeError: объект «numpy.ndarray» не имеет атрибута «toarray»

Я извлекаю функции из текстового корпуса, и для этого я использую векторизатор td-fidf и усеченное разложение по сингулярным значениям из scikit-learn. Однако, поскольку алгоритм, который я хочу опробовать, требует плотных матриц, а векторизатор...

23770 просмотров

06.10.2023

Статистические модели Python — взвешенный GLM

В настоящее время я работаю со значительно несбалансированными данными, используя пакет statsmodel GLM (или отдельную функцию логита, если это необходимо). До сих пор я не нашел способа реализовать взвешивание экземпляров в этих методах, однако я...

1141 просмотров

python statsmodels scikit-learn

26.11.2023

Почему в рамках стохастического градиентного спуска нет автоматического завершения?

Я проверил некоторые известные фреймворки с открытым исходным кодом с реализациями SGD — scikit-learn , vowpal-wabbit и тензор -поток . Все они оставляют пользователю задачу решить, сколько итераций! scikit требует, чтобы пользователь указал...

97 просмотров

tensorflow scikit-learn gradient-descent vowpalwabbit

19.10.2023

Возможно Dask-ify инкрементный PCA или стохастический градиентный спуск или другие алгоритмы частичного подбора scikit

На основе Инкрементного PCA для больших данных и документации по инкрементному PCA предлагается использовать карту памяти. array, но можно ли сделать то же самое с помощью dask? Обновление Расширен вопрос, чтобы включить другие алгоритмы...

427 просмотров

scikit-learn dask pca

27.11.2023

Могу ли я сделать логарифмическую регрессию на sklearn?

Я не знаю, подходит ли термин «логарифмическая регрессия», мне нужно подогнать кривую к моим данным, как полиномиальную кривую, но сглаживаясь на конце. Вот изображение, синяя кривая - это то, что у меня есть (полиномиальная регрессия 2-го...

12431 просмотров

python regression scikit-learn

20.12.2023

как передать смешанные (категориальные и числовые) функции регрессору дерева решений в sklearn?

Как я могу передать категориальные и числовые функции в DecisionTreeRegressor в sklearn? В приведенном ниже коде показано, как использовать DecisionTreeRegressor для числовых функций: from sklearn import tree make_tree =...

695 просмотров

python machine-learning scikit-learn decision-tree

24.11.2023

Линейная регрессия: хорошие результаты для обучающих данных, ужасные для тестовых данных.

Я работаю с набором данных размером около 400 000 x 250. У меня проблема с моделью, которая дает очень хороший результат R ^ 2 при тестировании на обучающем наборе, но очень плохо при использовании на тестовом наборе. Поначалу это звучит как...

1298 просмотров

python scikit-learn linear-regression

01.11.2023

Сравнение вывода GLMNET R с Python с использованием LogisticRegression()

Я использую логистическую регрессию с нормой L1 (LASSO). Я решил использовать пакет glmnet в R и LogisticRegression() из пакета sklearn.linear_model в python . Насколько я понимаю, это должно дать те же результаты, но это не так....

1209 просмотров

python r glmnet scikit-learn lasso-regression

19.11.2023

Индекс 38 выходит за пределы оси 1 с размером 38 - Sklearn

Я столкнулся с этой ошибкой с алгоритмом Naive Bayes's CategoricalNB Это дает указанную выше ошибку после второй попытки запуска ячеек. Это означает, что в первый раз он работает без каких-либо ошибок, и когда я пытаюсь что-то изменить...

661 просмотров

python pandas scikit-learn

02.10.2023

ValueError: ввод содержит NaN, даже при использовании SimpleImputer

Я пытаюсь работать с Titanic Dataset в качестве своего первого проекта Kaggle, и я столкнулся с этой ошибкой. Я продолжал искать решение здесь, в стеке, но до сих пор не могу его понять. Я создал два конвейера для предварительной обработки числовых...

112 просмотров

python pipeline scikit-learn

24.11.2023

Публикации по теме 'scikit-learn'

Показатели производительности для моделей машинного обучения (часть 1: среднеквадратическая ошибка — MSE)

Вопросы по теме 'scikit-learn'

Похожие вопросы