Αποθήκες Δεδομένων και Εξόρυξη Γνώσης από Δεδομένα [open] (321-9252)

Μ. Μαραγκουδάκης

Description

 

Το μάθημα αυτό έχει ως στόχο να καλύψει ένα μεγάλο μέρος της εξόρυξης γνώσης από δεδομένα και της οργάνωσης και διαχείρισης αποθηκών δεδομένων. Γίνεται εκτενής αναφορά στις διαδικασίες κατηγοριοποίησης, συσταδοποίησης και ανακάλυψης κανόνων συσχέτισης αλλά και ειδικότερες παρουσιάσεις σε πιο εξειδικευμένα αντικείμενα όπως η ανίχνευση εξαιρέσεων, η εξόρυξη γνώσης από κείμενα και η μείωση της διαστατικότητας. Το μάθημα πλαισιώνεται από εργαστήριο στο οποίο διδάσκονται όλα τα παραπάνω με ασκήσεις και πειραματικές μετρήσεις.

CC - Attribution-NonCommercial-ShareAlike
Περιεχόμενο μαθήματος

Ταξινόμηση των Σημάτων. Αναπαράσταση Σημάτων και Συστημάτων. Μοντέλο Τηλεπικοινωνιακών Συστημάτων. Μετασχηματισμός Hilbert. Ζωνοπερατά Σήματα και Συστήματα. Εισαγωγή στις μεθόδους μετάδοσης. Ανασκόπηση φασματικής ανάλυσης με σειρές και μετασχηματισμό Fourier. Βασικές έννοιες φίλτρων. Ανασκόπηση πιθανοτήτων και στοχαστικών διαδικασιών με έμφαση στις τηλεπικοινωνίες. Αναπαράσταση θορύβου. Αναλογική διαμόρφωση AM, FM, PM, φασματική ανάλυση, επίδραση θορύβου. Δειγματοληψία, κβαντισμός, κωδικοποίηση, θεώρημα Nyquist, Shannon. Παλμοαναλογική διαμόρφωση και τεχνικές κωδικοποίησης κυματομορφών PCM, PAM. Διαμορφώσεις παλμών. Τεχνικές ψηφιακής διαμόρφωσης (ASK, PSK, FSK, M-QAM), φασματική ανάλυση, επίδραση θορύβου.

Μαθησιακοί στόχοι

Στόχος του μαθήματος είναι η κατανόηση βασικών αρχών της θεωρίας των τηλεπικοινωνιών και των εφαρμογών της. Γίνεται εισαγωγή στις βασικές αρχές ανάλυσης και σχεδίασης των τηλεπικοινωνιακών συστημάτων και στις τεχνολογίες μετάδοσης του φυσικού στρώματος. Με την ολοκλήρωση του μαθήματος ο σπουδαστής θα είναι σε θέση να κατανοήσει τη διάδοση των πληροφοριών και τις τεχνικές που την διέπουν και τις τεχνικές που είναι απαραίτητες για την υλοποίηση βασικών τηλεπικοινωνιακών συστημάτων μετάδοσης δεδομένων. Το εργαστηριακό τμήμα του μαθήματος περιλαμβάνει την εκτέλεση εργαστηριακών ασκήσεων για την καλύτερη κατανόηση και εμπέδωση από πλευράς των φοιτητών των βασικών αρχών των αναλογικών τηλεπικοινωνιακών συστημάτων, καθώς και εξοικείωση με τα εργαστηριακά όργανα.

Βιβλιογραφία
  • Data Mining-Foundations and Practice, Lin, Xie, Wasilewska and Liau, Springer-Verlag Berlin and Heidelberg GmbH & Co. KG, ISBN10: 354078487X, 2008.
Μέθοδοι διδασκαλίας

Διδασκαλία σε αίθουσα, ομαδικές δραστηριότητες, ηλεκτρονική πλατφόρμα μάθησης.

Μέθοδοι αξιολόγησης

Ατομικές και ομαδικές εργασίες, πρακτική εξάσκηση στο εργαστήριο, μικρά τεστ στη μορφή κουίζ, τελική γραπτή εξέταση.

Προαπαιτούμενα

Δεν υπάρχουν.

Διδάσκοντες

 

Ο καθηγητής κ. Μαραγκουδάκης Εμμανουήλ έλαβε διδακτορικό από το Τμήμα Ηλεκτρολόγων Μηχανικών & Τεχνολογίας Υπολογιστών , Πανεπιστήμιο Πατρών, δίπλωμα στην Επιστήμη των Υπολογιστών από το Τμήμα Επιστήμης Υπολογιστών, Πανεπιστήμιο Κρήτης. Ο τίτλος της διατριβής είναι " The thesis was entitled “Μοντελοποίηση και Συμπερασμός υπό συνθήκες αβεβαιότητας σε Διαλογικά και άλλα Συστήματα Φυσικής Γλώσσας με Τεχνικές Δικτύων Bayes”.

Εργάζεται ως επίκουρος καθηγητής στο Τμήμα Μηχανικών Πληροφοριακών & Επικοινωνιακών Συστημάτων στο Πανεπιστήμιο Αιγαίου με γνωστικό αντικείμενο την "Εξόρυξη Γνώσης από Δεδομένα".
Επιπρόσθετα, είναι ο τμηματικός υπεύθυνος για το πρόγραμμα: LLP/Erasmus του Πανεπιστημίου Αιγαίου.

Προτεινόμενα συγγράμματα
  • Data Mining-Introductory and Advanced Topics, Margaret H. Dunham, Pearson Education, ISBN: 9780130888921, 2002.
  • Data Mining, A Knowledge Discovery Approach, Krzysztof J. Cios et al., Springer Verlag, ISBN: 9780387333335, 2007.

Units

 Τιμές και χαρακτηριστικά

 Σώματα δεδομένων

 Εγγραφές-Συναλλαγές-Γράφοι

 Θόρυβος και Εξαιρέσεις

 Δειγματοληψία

 Διαστατικότητα

 Αποστάσεις Διανυσμάτων

 Το σώμα δεδομένων IRIS
 Μέτρα θέσεως
 Αναπαράσταση και ταξινόμηση
 Box, scatter,matrix plots
 Παράλληλες συντεταγμένες
 Star Plots-Sticky Figures

 Δέντρα αποφάσεων
 Μετρητές ποιότητας διαχωρισμού
 Overfitting και  Under Fitting
 Αποτίμηση μοντέλου
 Καμπύλες ROC
 Κανόνες Απόφασης
 Bayesian κατηγοριοποίηση
 Parzen Windows-Neural Networks
 Support Vector Machines
 Genetic Algorithms
 Ensemble Classifiers

 Τύποι συστάδων
 K-means
 Hierarchical Clustering
 DBSCAN
 Expectation Maximization

 Apriori
 FP-Growth
 Μέτρα αποτίμησης κανόνων
 Support-based pruning
 Κανόνες συσχέτισης πολλών επιπέδων

 Ανίχνευση Εξαιρέσεων
 Latent Semantic Indexing-Text mining
 Feature Reduction- Singular Value Decomposition

 Λειτουργίες OLAP
 Κύβος Δεδομένων
 Κυβοειδή και αρχιτεκτονικές OLAP
 OLAP Servers
 Συντήρηση Αποθηκών Δεδομένων

Περιλαμβάνει δείγματα διαλέξεων από εργαστήριο που αφορά το συγκεκριμένο μάθημα.

Open Academic Course

Open Courses
OpenCourses Level: A+

Num. of Visits :  4145
Num. of Hits :  22052

Calendar