Metoda Holdout în piton

voturi
0

Cum se face 6: 4 Holdout în Python? Am încercat următorul cod:

X_train, X_test, y_train, y_test =  train_test_split(X,y, training_size=0.6, test_size=0.4)

Dar nu sunt sigur dacă e corect sau nu.

Întrebat 09/10/2019 la 12:55
sursa de către utilizator
În alte limbi...                            


1 răspunsuri

voturi
2

Consultați documentația de train_test_splitla scikit-invata.

Pentru a seta atât dimensiunea de formare și setul de testare trebuie să treacă train_size(nu training_sizeca în codul) și test_size.

Pentru a utiliza 60% din datele de formare și de 40% pentru testarea puteți utiliza acest lucru:

import numpy as np
from sklearn.model_selection import train_test_split

X = np.random.rand(100, 2)
y = range(100)

X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.6, test_size=0.4)

Puteți confirma că pentru 100 de datapoints utilizate în acest exemplu, veți obține o dimensiune set de tren de 60 și o dimensiune set de testare de 40:

print(len(X_train), len(X_test))
print(len(y_train), len(y_test))
> 60 40
> 60 40
Publicat 09/10/2019 la 13:53
sursa de către utilizator

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more