Default Dataset
Balanced english Wikipedia dataset used to train the prediction models. The dataset considers 6 classes (FA, GA, B, C, Start, Stub) and all 145 features. Titles for each quality level were randomly picked from the previously generated "Wikipedia Titles". Network features use the "Wikipedia Graph" information. - 6000x6-csrhn_train.csv: Training data. Comprises ~70% of the dataset. - 6000x6-csrhn_train.csv: Testing data. Comprises ~30% of the dataset.
このリソースのために作成されたビューはまだありません
追加情報
フィールド | 値 |
---|---|
最終更新日 | 2022年6月27日 |
メタデータ最終更新日時 | 2024年5月27日 |
作成日 | 2022年6月27日 |
データ形式 | ZIP |
ライセンス | Creative Commons Attribution |
Datastore active | False |
Has views | False |
Id | 64685bd4-5d85-4b9f-88eb-b7cdedf1e9a6 |
Package id | 24f17b48-304f-4c07-8f5d-2c9b62e25730 |
Position | 3 |
State | active |
Url type | upload |