Публикации по теме 'scikit-learn'


Показатели производительности для моделей машинного обучения (часть 1: среднеквадратическая ошибка — MSE)
Метрики регрессии с использованием Python, доктор Элвин Анг https://www.alvinang.sg/s/Regression_Metrics_for_ML_Models_R2_and_MSE_by_Dr_Alvin_Ang.ipynb Когда использовать Что? Самые популярные регрессионные метрики MSE измеряет насколько близки прогнозированные значения к истинным значениям (не включает подгонку кривой) Показатель R2  – это показатель того, насколько прогнозируемые значения соответствуют общей тенденции данных. (Goodness-of-Fit)..

Вопросы по теме 'scikit-learn'

AttributeError: объект «numpy.ndarray» не имеет атрибута «toarray»
Я извлекаю функции из текстового корпуса, и для этого я использую векторизатор td-fidf и усеченное разложение по сингулярным значениям из scikit-learn. Однако, поскольку алгоритм, который я хочу опробовать, требует плотных матриц, а векторизатор...
23770 просмотров

Статистические модели Python — взвешенный GLM
В настоящее время я работаю со значительно несбалансированными данными, используя пакет statsmodel GLM (или отдельную функцию логита, если это необходимо). До сих пор я не нашел способа реализовать взвешивание экземпляров в этих методах, однако я...
1141 просмотров
schedule 26.11.2023

Почему в рамках стохастического градиентного спуска нет автоматического завершения?
Я проверил некоторые известные фреймворки с открытым исходным кодом с реализациями SGD — scikit-learn , vowpal-wabbit и тензор -поток . Все они оставляют пользователю задачу решить, сколько итераций! scikit требует, чтобы пользователь указал...
97 просмотров

Возможно Dask-ify инкрементный PCA или стохастический градиентный спуск или другие алгоритмы частичного подбора scikit
На основе  Инкрементного PCA для больших данных  и документации по инкрементному PCA предлагается использовать карту памяти. array, но можно ли сделать то же самое с помощью dask? Обновление Расширен вопрос, чтобы включить другие алгоритмы...
427 просмотров
schedule 27.11.2023

Могу ли я сделать логарифмическую регрессию на sklearn?
Я не знаю, подходит ли термин «логарифмическая регрессия», мне нужно подогнать кривую к моим данным, как полиномиальную кривую, но сглаживаясь на конце. Вот изображение, синяя кривая - это то, что у меня есть (полиномиальная регрессия 2-го...
12431 просмотров
schedule 20.12.2023

как передать смешанные (категориальные и числовые) функции регрессору дерева решений в sklearn?
Как я могу передать категориальные и числовые функции в DecisionTreeRegressor в sklearn? В приведенном ниже коде показано, как использовать DecisionTreeRegressor для числовых функций: from sklearn import tree make_tree =...
695 просмотров

Линейная регрессия: хорошие результаты для обучающих данных, ужасные для тестовых данных.
Я работаю с набором данных размером около 400 000 x 250. У меня проблема с моделью, которая дает очень хороший результат R ^ 2 при тестировании на обучающем наборе, но очень плохо при использовании на тестовом наборе. Поначалу это звучит как...
1298 просмотров
schedule 01.11.2023

Сравнение вывода GLMNET R с Python с использованием LogisticRegression()
Я использую логистическую регрессию с нормой L1 (LASSO). Я решил использовать пакет glmnet в R и LogisticRegression() из пакета sklearn.linear_model в python . Насколько я понимаю, это должно дать те же результаты, но это не так....
1209 просмотров

Индекс 38 выходит за пределы оси 1 с размером 38 - Sklearn
Я столкнулся с этой ошибкой с алгоритмом Naive Bayes's CategoricalNB Это дает указанную выше ошибку после второй попытки запуска ячеек. Это означает, что в первый раз он работает без каких-либо ошибок, и когда я пытаюсь что-то изменить...
661 просмотров
schedule 02.10.2023

ValueError: ввод содержит NaN, даже при использовании SimpleImputer
Я пытаюсь работать с Titanic Dataset в качестве своего первого проекта Kaggle, и я столкнулся с этой ошибкой. Я продолжал искать решение здесь, в стеке, но до сих пор не могу его понять. Я создал два конвейера для предварительной обработки числовых...
112 просмотров
schedule 24.11.2023