Αποθήκες Δεδομένων και Εξόρυξη Γνώσης από Δεδομένα [open] (321-9252)

Άσκηση αυτοαξιολόγησης - Ενότητα 2η (Οπτική εξερεύνηση - Προεπεξεργασία)

Question 1 (Free Text — 50 grades) 

1. Πως μπορώ να οπτικοποιήσω ένα σώμα δεδομένων που έχει 5 μεταβλητές (συνεχείς) και μια κλάση με δυο διακριτές τιμές (True, False). Ποια είναι γενικά η αξία της οπτικοποίησης (visualization);

Question 2 (Free Text — 50 grades) 

2. Έστω το ακόλουθο σώμα δεδομένων. Να εξηγήσετε ποιες μεταβλητές είναι κατάλληλες για κατηγοριοποίηση. Στη συνέχεια, να φτιάξετε το δέντρο απόφασης με κριτήριο το Information Gain.

ID

  Name

  AgeGroup

  CarType

  CrashRisk (ΚΛΑΣΗ)

1

Ben

30-40

Family

Low

2

Paul

20-30

Sports

High

3

Bill

40-50

Sports

High

4

James

30-40

Family

Low

5

Anna

20-30

Sports

High

6

Den

40-50

Family

Low