Default Dataset
Balanced english Wikipedia dataset used to train the prediction models. The dataset considers 6 classes (FA, GA, B, C, Start, Stub) and all 145 features. Titles for each quality level were randomly picked from the previously generated "Wikipedia Titles". Network features use the "Wikipedia Graph" information. - 6000x6-csrhn_train.csv: Training data. Comprises ~70% of the dataset. - 6000x6-csrhn_train.csv: Testing data. Comprises ~30% of the dataset.
이 리소스를 위해 생성된 뷰가 아직 없습니다.
추가 정보
필드 | 값 |
---|---|
마지막으로 업데이트된 데이터 | 2022년 6월 27일 |
마지막으로 업데이트된 메타데이터 | 2024년 5월 27일 |
생성됨 | 2022년 6월 27일 |
포맷 | ZIP |
라이센스 | Creative Commons Attribution |
Datastore active | False |
Has views | False |
Id | 64685bd4-5d85-4b9f-88eb-b7cdedf1e9a6 |
Package id | 24f17b48-304f-4c07-8f5d-2c9b62e25730 |
Position | 3 |
State | active |
Url type | upload |