Default Dataset
عنوان الموقع URL: https://rdm.inesctec.pt/dataset/24f17b48-304f-4c07-8f5d-2c9b62e25730/resource/64685bd4-5d85-4b9f-88eb-b7cdedf1e9a6/download/default-dataset.zip
Balanced english Wikipedia dataset used to train the prediction models. The dataset considers 6 classes (FA, GA, B, C, Start, Stub) and all 145 features. Titles for each quality level were randomly picked from the previously generated "Wikipedia Titles". Network features use the "Wikipedia Graph" information. - 6000x6-csrhn_train.csv: Training data. Comprises ~70% of the dataset. - 6000x6-csrhn_train.csv: Testing data. Comprises ~30% of the dataset.
لا توجد صيغ عرض منشأة لهذا المورد بعد.
معلومات إضافية
حقل | القيمة |
---|---|
آخر تحديث للبيانات | 27 يونيو 2022 |
آخر تحديث للبيانات الوصفية | 27 مايو 2024 |
أنشئت | 27 يونيو 2022 |
تنسيق | ZIP |
الترخيص | Creative Commons Attribution |
Datastore active | False |
Has views | False |
Id | 64685bd4-5d85-4b9f-88eb-b7cdedf1e9a6 |
Package id | 24f17b48-304f-4c07-8f5d-2c9b62e25730 |
Position | 3 |
State | active |
Url type | upload |