Ανάλυση Κατηγορικών Δεδομένων (Μεταπτυχιακό) [open]

Στέλιος Ζήμερας

Περιγραφή

Ορισμός και ανάλυση πινάκων συνάφειας (odds ratio, risk ratio), έλεγχος προσαρμογής, μοντέλα για κατηγορικές μεταβλητές, λογιστική παλινδρόμηση, Κατηγορικές κατανομές, Δειγματοληψία σε κατηγορικά δεδομένα, Πιθανοφάνεια, Μέτρα συνάφειας, λογιστική παλινδρόμηση, Γενικευμένα γραμμικά μοντέλα.

CC - Αναφορά - Μη Εμπορική Χρήση - Όχι Παράγωγα Έργα
Διδάσκοντες

Στέλιος Ζήμερας

 

Dr. Stelios Zimeras holds a BSc. (Hons) on Statistics and Insurance Sciences from University of Piraeus (5fth in the rank) and Ph.D. on Statistics from the University of Leeds, U.K. He had received a full scholarship (fees and maintenance) during his research studies (1993-1997) from the University of Leeds.  Since 2008, he is a full time staff member (Assistant Prof) on statistics and probabilities at the Department of Mathematics, Division of Statistics and Financial-Actuarial Mathematics, University of the Aegean, Samos, Greece. He had worked as post-doc at University of Leeds, Department of Electrical Engineering (funded by EPSRC), at IRISA/INRIA-VISTA PROJECT institute, France (funded by EUMETSAT-ESA) and at MedCom GmbH, Germany (funded by Marie-Curie grants). Finally 2011-2012 he had worked during his sabbatical in University of Piraeus, Department of Digital Systems, in computer virus modelling.

In 2011 he has nominated the Best Paper for the 5th International Conference on Energy and Development - Environment - Biomedicine 2011 (EDEB '11) with title “Spatial Uncertainty”, pp. 203-208, by S. Zimeras, Y. Matsinos. He has involved in national and international projects (FP7, ESPA, Marie-Curie) involving Data Processing. Finally, he has publish 42 papers, 20 chapters in books, and 46 conference papers.  

His published material and presentations are on a number of topics of Data Processing, Statistical Simulations, Image analysis, Medical Image analysis, Spatial Statistics, Telemedicine, and Statistical Modelling with applications in biology, ecology, and medicine, statistical epidemiology, and Bayesian statistics. He has been a member of a number of professional and scientific societies and associations; while he is a reviewer for a number of conferences.

Περιεχόμενο μαθήματος
  1. Εισαγωγή
  2. Πίνακες συνάφειας – Ανεξαρτησία – έλεγχοι ποσοστών
  3. Δειγματολήψια Poisson, πολυωνυμική, ανεξάρτητη πολυωνυμική – δοκιμασία καλής προσαρμογής
  4. Έλεγχος ανεξαρτησίας x2
  5. Μέθοδος μέγιστης πιθανοφάνειας – λόγος πιθανοφανειών
  6. Διαμέριση
  7. Μέτρα συνάφειας
  8. Μέτρα κινδύνου για κατηγορικά δεδομένα
  9. Λογιστική παλινδρόμηση
  10. Γενικευμένα γραμμικά μοντέλα
Μαθησιακοί στόχοι

Κατά την διάρκεια των ενοτήτων του μαθήματος, οι φοιτητές θα αποκτήσουν γνώσεις πάνω: στις κατανομές κατηγορικών δεδομένων, στην χρήση πιθανοτήτων σε συνδυασμό με την ανάλυση κατηγορικών δεδομένων, στην χρήση μεθόδων πιθανοφάνειας, στην χρήση μεθόδων καλής προσαρμογής, στην ανάλυση μέτρων συνάφειας, και στην ανάλυση κινδύνων απαραίτητων στην βιοστατιστική.

Μέθοδοι διδασκαλίας

Η μέθοδος διδασκαλίας που χρησιμοποιείται είναι η διδασκαλία καθ’ έδρας με συμπληρωματική ενίσχυση από πλευράς ασκήσεων τόσο μέσα στην αίθουσα τόσο όσο και κατ’ιδίαν στους φοιτητές.

Μέθοδοι αξιολόγησης

Το μάθημα εξετάζεται στο τέλος του εξαμήνου με εξετάσεις. Κατά την διάρκεια των μαθημάτων δίνονται ασκήσεις με σκοπό να βοηθήσουν την καλύτερη κατανόηση της ύλης του μαθήματος. Οι ασκήσεις λαμβάνονται ως μπόνους κατά το τέλος των εξετάσεων και δεν είναι υποχρεωτικές. Κατά την διάρκεια των μαθημάτων δίνονται αλλά και λύνονται ασκήσεις παλαιότερων ετών με σκοπό οι φοιτητές να κατανοήσουν την μορφή των θεμάτων κατά την περίοδο των εξετάσεων.

Προαπαιτούμενα

Πιθανότητες Ι (331-2055) , Πιθανότητες ΙΙ) (331-2306), Στατιστική Ι (331-2158), Στατιστική ΙΙ (331-2454) και Εφαρμοσμένη Γραμμική Άλγεβρα Ι (331-1170).

Προτεινόμενα συγγράμματα

Σημειώσεις διδάσκοντα, ασκήσεις.

Βιβλιογραφία

Δεν υπάρχει ελληνική βιβλιογραφία – εκτός από σημειώσεις

Ομάδα στόχος

Φοιτητές τμήματος Στατιστικής με θεματικές περιοχές: Πιθανότητες, Στατιστική, Βιοστατιστική, Ιατρική Στατιστική.

Ενότητες

Κατά την ενότητα αυτή γίνεται μια γενική εισαγωγή στα είδη των μεταβλητών που αναλύονται στα κατηγορικά δεδομένα καθώς και οι εκάστοτε κατανομές που χρησιμοποιούνται.

Στην ενότητα αυτή αναλύονται λεπτομερώς οι πίνακες συνάφειας καθώς και η σχέση τους με τις πιθανότητες. Αποδεικνύονται τα αντίστοιχα θεωρήματα για την ανεξαρτησία μεταξύ κατηγορικών μεταβλητών και αναλύονται οι έλεγχοι υποθέσεων για σύγκριση ποσοστών γενικά αλλά και ειδικότερα σε πίνακες συνάφειας 2x2. Σε κάθε ανάλυση ακολουθεί σειρά ασκήσεων για την καλύτερη κατανόηση από τους φοιτητές.

Στην ενότητα αυτή γίνεται πλήρης ανάλυση των μεθόδων δειγματοληψίας από πίνακες συνάφειας μετά από χρήση των κατανομών Poisson, πολυωνυμικής και ανεξάρτητων πολυωνυμικών. Ταυτόχρονα δίνονται αποδείξεις στα αντίστοιχα θεωρήματα. Αναλύεται με παραδείγματα η μεθοδολογία καλής προσαρμογής.

Στην ενότητα αυτή δίνεται λεπτομερή ανάλυση της μεθοδολογίας ελέγχου ανεξαρτησίας με αποδείξεις και παραδείγματα. Επίσης αναλύεται η μεθοδολογία της ανεξαρτησίας κάτω από χρήση των κατανομών Poisson, πολυωνυμικής και ανεξάρτητων πολυωνυμικών.

Στην ενότητα αυτή γίνεται ανάλυση της μεθοδολογίας μέγιστης πιθανοφάνειας καθώς και η αντιστοίχηση των συναρτήσεων πιθανοφάνειας κάτω από χρήση των κατανομών Poisson, πολυωνυμικής και ανεξάρτητων πολυωνυμικών. Αντίστοιχες ασκήσεις ενισχύουν την κατανόηση των μεθόδων από τους φοιτητές. Επίσης αναλύεται τρόπος επιλογής κατάλληλου μοντέλου μέσα από την ανάλυση της μεθόδου των λόγων πιθανοφανειών.

Στην ενότητα αυτή γίνεται ανάλυση της διαδικασίας διαμέρισης πινάκων συνάφειας τετραγωνικών και μη-τετραγωνικών. Επίσης αναλύονται οι ιδιότητες  και τα χαρακτηριστικά της διαδικασίας.

Στην ενότητα αυτή αναλύονται τα περισσότερα μέτρα συνάφειας των μεταβλητών κάτω από τετραγωνικούς, μη τετραγωνικούς και 2x2 πίνακες συνάφειας.

Στην ενότητα αυτή αναλύονται στατιστικά από πλευράς συμπερασματολογίας τα αντίστοιχα μέτρα κινδύνου που εντοπίζονται στην ανάλυση επιβίωσης, βιοστατιστική και ανάλυση θνησιμότητας.

Στην ενότητα αυτή αναλύεται η έννοια της μη – γραμμικής μοντελοποίησης μέσα από την παρουσίαση της λογιστικής παλινδρόμησης. Υπολογίζονται στατιστικά μέτρα, καθώς και εκτιμήσεις παραμέτρων κάνοντας χρήση της μεθόδου μέγιστης πιθανοφάνειας.

Στην ενότητα αυτή αναλύεται με λεπτομέρεια η διαδικασία μοντελοποίησης κατηγορικών δεδομένων με χρήση γενικευμένων μοντέλων. Επίσης αναλύονται παραδείγματα με βάση τις συναρτήσεις σύνδεσης των γενικευμένων μοντέλων ως προς τα κατηγορικά δεδομένων (logit, probit) και ερμηνεύεται η προσαρμογή του λογιστικού μοντέλου μέσα από την διαδικασία μέγιστης πιθανοφάνειας.

Ανοικτό Ακαδ. Μάθημα

Ανοικτά Ακαδημαϊκά Μαθήματα
Επίπεδο: A+

Αρ. Επισκέψεων :  4345
Αρ. Προβολών :  21088

Ημερολόγιο