Αποθήκες Δεδομένων και Εξόρυξη Γνώσης από Δεδομένα [open] (321-9252)

Άσκηση αυτοαξιολόγησης - Ενότητα 3η (Κατηγοριοποίηση)

Question 1 (Free Text — 30 grades) 

Μεταξύ των αλγορίθμων που ακολουθούν. Ποιος(οι) είναι γρήγορος(οι) στην εκπαίδευση και αργός(οι) στην ταξινόμηση; Ποιος(οι) παράγει(ουν) κανόνες ταξινόμησης; Ποιος(οι) απαιτεί(ουν) διακριτοποίηση των συνεχών μεταβλητών πριν την εφαρμογή τους;

A. C4.5 decision tree
B. One-R
C. 1-Nearest Neighbor
D. Naive Bayes
E. Linear Regression

Question 2 (Free Text — 30 grades) 

Για το ακόλουθο σώμα δεδομένων, να δημιουργήσετε ένα training set πρόβλεψης της Βροχόπτωσης της επόμενης μέρας με βάση τις υπόλοιπες παραμέτρους της προηγούμενης ημέρας. Να εφαρμόσετε τον αλγόριθμο Radial Basis Function Neural Networks με χρήση 2 κέντρων της αρεσκείας σας, χωρίς να κάνετε πράξεις, να δείξετε τη δομή του δικτύου και πως θα προκύπτουν οι μετασχηματισμοί με τον Gaussian kernel.

Ημέρα

 Πίεση

 Θερμοκρασία

 Υγρασία

 Βροχόπτωση

 

1

21.2

21

87

1,4

 

2

19

20

89

1,5

 

3

18

18

50

0

 

4

22

18

41

0

 

5

13

22

90

2

 

Question 3 (Free Text — 40 grades) 

3. Για το ακόλουθο σώμα δεδομένων, εξηγείστε πως δουλεύει ο αλγόριθμος Adaboost πάνω σε αυτό με έναν απλό ταξινομητή δέντρου αποφάσεων (decision stump).

 

Att1

 Class

1

TRUE

1.5

TRUE

2

FALSE

2.5

FALSE

3

FALSE