Я столкнулся с этой ошибкой с алгоритмом Naive Bayes's
CategoricalNB
Это дает указанную выше ошибку после второй попытки запуска ячеек. Это означает, что в первый раз он работает без каких-либо ошибок, и когда я пытаюсь что-то изменить (например, комментарий) и снова запустить ноутбук, он выдает ошибку:
IndexError: индекс 38 выходит за пределы оси 1 с размером 38
Я не знаю, что не так и как исправить. Когда я перезапускаю ядро и пытаюсь снова, оно работает, и каждая попытка после 1-й попытки терпит неудачу и дает указанную выше ошибку.
%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd
dataframe = pd.read_csv("hr_dataset.csv")
# dataframe = pd.read_csv("WA_Fn-UseC_-HR-Employee-Attrition.csv")
dataframe.head(2)
from sklearn.naive_bayes import CategoricalNB
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
# inputs = scaled_df
X_train, X_test, y_train, y_test = train_test_split(inputs, target, test_size=0.2)
categoricalNB_ = CategoricalNB()
categoricalNB_.fit(X_train, y_train)
X_train.shape, X_test.shape, y_train.shape, y_test.shape
pred = categoricalNB_.predict(X_test) # --------------> gives the error for every attempt after the 1st attempt. weird
categoricalNB_.score(X_test, y_test)
# accuracy_score(y_test,pred)
n
элементов, действительные (положительные) индексы составляют от 0 до n - 1 (включительно). - person norok2   schedule 26.05.2020X_train
, иX_test
имеют одинаковые строки, а такжеX_test
иy_test
- person Escort Personal Adz   schedule 26.05.2020"hr_dataset.csv"
, либо минимальный набор данных, показывающий проблему). См. Также здесь. - person norok2   schedule 26.05.2020https://drive.google.com/open?id=19gWVwuXS3my9C77D9unG53tuivPzZdqJ
- person Escort Personal Adz   schedule 26.05.2020X_test
после строки, что создает проблему, и когда вы снова запустите его, он будет использовать другойX_test
. Вы должны проверить, что у вас есть вX_test
перед строкой, которая создает проблему. По крайней мере, проверьтеshape
. Но если вы проверите значения вX_test
, то, возможно, вы поймете, почему они разные. - person furas   schedule 26.05.2020