У меня есть два набора данных: тестовый и обучающий. Я собрал их в один csv. Я хочу разделить свои данные для обучения и тестирования. Но это не должно быть случайным. Мне нужно разделить первые 808699 строк поезда, а остальные в качестве теста?
Я пытался прочитать два разных CSV, но не смог.
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(x,y,train_size=808698,test_size=121918,random_state=1)
ValueError: train_size=808698 should be either positive and smaller than the number of samples 121921 or a float in the (0, 1) range