Публикации по теме 'scikit-learn'
Показатели производительности для моделей машинного обучения (часть 1: среднеквадратическая ошибка — MSE)
Метрики регрессии с использованием Python, доктор Элвин Анг
https://www.alvinang.sg/s/Regression_Metrics_for_ML_Models_R2_and_MSE_by_Dr_Alvin_Ang.ipynb
Когда использовать Что?
Самые популярные регрессионные метрики
MSE измеряет насколько близки прогнозированные значения к истинным значениям (не включает подгонку кривой)
Показатель R2 – это показатель того, насколько прогнозируемые значения соответствуют общей тенденции данных. (Goodness-of-Fit)..
Вопросы по теме 'scikit-learn'
AttributeError: объект «numpy.ndarray» не имеет атрибута «toarray»
Я извлекаю функции из текстового корпуса, и для этого я использую векторизатор td-fidf и усеченное разложение по сингулярным значениям из scikit-learn. Однако, поскольку алгоритм, который я хочу опробовать, требует плотных матриц, а векторизатор...
23770 просмотров
schedule
06.10.2023
Статистические модели Python — взвешенный GLM
В настоящее время я работаю со значительно несбалансированными данными, используя пакет statsmodel GLM (или отдельную функцию логита, если это необходимо). До сих пор я не нашел способа реализовать взвешивание экземпляров в этих методах, однако я...
1141 просмотров
schedule
26.11.2023
Почему в рамках стохастического градиентного спуска нет автоматического завершения?
Я проверил некоторые известные фреймворки с открытым исходным кодом с реализациями SGD — scikit-learn , vowpal-wabbit и тензор -поток .
Все они оставляют пользователю задачу решить, сколько итераций! scikit требует, чтобы пользователь указал...
97 просмотров
schedule
19.10.2023
Возможно Dask-ify инкрементный PCA или стохастический градиентный спуск или другие алгоритмы частичного подбора scikit
На основе Инкрементного PCA для больших данных и документации по инкрементному PCA предлагается использовать карту памяти. array, но можно ли сделать то же самое с помощью dask?
Обновление Расширен вопрос, чтобы включить другие алгоритмы...
427 просмотров
schedule
27.11.2023
Могу ли я сделать логарифмическую регрессию на sklearn?
Я не знаю, подходит ли термин «логарифмическая регрессия», мне нужно подогнать кривую к моим данным, как полиномиальную кривую, но сглаживаясь на конце.
Вот изображение, синяя кривая - это то, что у меня есть (полиномиальная регрессия 2-го...
12431 просмотров
schedule
20.12.2023
как передать смешанные (категориальные и числовые) функции регрессору дерева решений в sklearn?
Как я могу передать категориальные и числовые функции в DecisionTreeRegressor в sklearn?
В приведенном ниже коде показано, как использовать DecisionTreeRegressor для числовых функций:
from sklearn import tree
make_tree =...
695 просмотров
schedule
24.11.2023
Линейная регрессия: хорошие результаты для обучающих данных, ужасные для тестовых данных.
Я работаю с набором данных размером около 400 000 x 250. У меня проблема с моделью, которая дает очень хороший результат R ^ 2 при тестировании на обучающем наборе, но очень плохо при использовании на тестовом наборе. Поначалу это звучит как...
1298 просмотров
schedule
01.11.2023
Сравнение вывода GLMNET R с Python с использованием LogisticRegression()
Я использую логистическую регрессию с нормой L1 (LASSO).
Я решил использовать пакет glmnet в R и LogisticRegression() из пакета sklearn.linear_model в python . Насколько я понимаю, это должно дать те же результаты, но это не так....
1209 просмотров
schedule
19.11.2023
Индекс 38 выходит за пределы оси 1 с размером 38 - Sklearn
Я столкнулся с этой ошибкой с алгоритмом Naive Bayes's CategoricalNB
Это дает указанную выше ошибку после второй попытки запуска ячеек. Это означает, что в первый раз он работает без каких-либо ошибок, и когда я пытаюсь что-то изменить...
661 просмотров
schedule
02.10.2023
ValueError: ввод содержит NaN, даже при использовании SimpleImputer
Я пытаюсь работать с Titanic Dataset в качестве своего первого проекта Kaggle, и я столкнулся с этой ошибкой. Я продолжал искать решение здесь, в стеке, но до сих пор не могу его понять.
Я создал два конвейера для предварительной обработки числовых...
112 просмотров
schedule
24.11.2023