Default Dataset
Balanced english Wikipedia dataset used to train the prediction models. The dataset considers 6 classes (FA, GA, B, C, Start, Stub) and all 145 features. Titles for each quality level were randomly picked from the previously generated "Wikipedia Titles". Network features use the "Wikipedia Graph" information. - 6000x6-csrhn_train.csv: Training data. Comprises ~70% of the dataset. - 6000x6-csrhn_train.csv: Testing data. Comprises ~30% of the dataset.
Tälle resurssille ei ole luotu vielä yhtään näkymää.
Lisätietoa
Kenttä | Arvo |
---|---|
Data viimeksi päivitetty | 27. kesäkuuta 2022 |
Metatieto viimeksi päivitetty | 27. toukokuuta 2024 |
Luotu | 27. kesäkuuta 2022 |
Muoto | ZIP |
Lisenssi | Creative Commons Attribution |
Datastore active | False |
Has views | False |
Id | 64685bd4-5d85-4b9f-88eb-b7cdedf1e9a6 |
Package id | 24f17b48-304f-4c07-8f5d-2c9b62e25730 |
Position | 3 |
State | active |
Url type | upload |