Μαθησιακά Αποτελέσματα
Η εξόρυξη γνώσης από δεδομένα αφορά τη διαδικασία επιλογής, διερεύνησης και ανάλυσης μεγάλου όγκου δεδομένων, με στόχο την ανακάλυψη προτύπων και κανόνων που εμφανίζουν ιδιαίτερο ενδιαφέρον. Η διαδικασία αυτή μετατρέπει τα απλά δεδομένα σε χρήσιμη γνώση, η οποία είναι απαραίτητη για τη λήψη αποφάσεων σχεδόν σε κάθε οργανισμό.
Το μάθημα προσφέρει στους σπουδαστές τις απαραίτητες γνώσεις και δεξιότητες που απαιτούνται για την μετατροπή των δεδομένων σε επιχειρηματική ευφυΐα. Αυτό γίνεται σταδιακά: αρχικά με την παρουσίαση των βασικών τεχνικών που συναντούνται στη βιβλιογραφία, όπως η ταξινόμηση, η συσταδοποίηση, η εύρεση κανόνων συσχέτισης κλπ, στη συνέχεια με την πρακτική εφαρμογή των πιο δημοφιλών αλγορίθμων και τεχνικών σε σύνολα δεδομένων με τη χρήση εργαλείων ανοικτού κώδικα και εμπορικών εφαρμογών και τέλος με τη μελέτη περιπτώσεων που παρουσιάζουν αυξημένο ερευνητικό και επιχειρηματικό ενδιαφέρον στις μέρες μας.
Περιεχόμενο Μαθήματος
Η φιλοσοφία των Συστημάτων Υποστήριξης Αποφάσεων (ΣΥΑ) και ο ρόλος τους στις διαδικασίες λήψης αποφάσεων στην επιχείρηση. Εξόρυξη γνώσης και επιχειρηματική ευφυΐα.
Επιβλεπόμενη/Μη επιβλεπόμενη/Μερικώς επιβλεπόμενη μάθηση. Προετοιμασία δεδομένων. Κατηγοριοποίηση. Συσταδοποίηση. Κανόνες συσχέτισης και ακολουθιακά πρότυπα.
Αποθήκες δεδομένων, OLAP. Διαχείριση δεδομένων σε Ν-διαστάσεις. Ιεραρχίες διαστάσεων και υπερκύβοι, Σχεσιακά και πολυδιάστατα μοντέλα., Εργαλεία για εξόρυξη γνώσης – συγκριτική παρουσίαση.
Εξόρυξη δεδομένων από κείμενα. Εξόρυξη δεδομένων από το web. Εξόρυξη γνώσης από δεδομένα αγορών. Εξόρυξη γνώσης από ιατρικά και βιολογικά δεδομένα.
1η εβδομάδα (Διάλεξη): Εισαγωγή στη θεωρία Αποφάσεων. Τύποι αποφάσεων και προσεγγίσεις. Ο ρόλος των Συστημάτων Υποστήριξης Αποφάσεων (ΣΥΑ) στις διαδικασίες λήψης αποφάσεων στην επιχείρηση. Διαθέσιμες λύσεις και αρχιτεκτονικές. Τα στάδια ανάπτυξης ενός συστήματος επιχειρηματικής ευφυΐας.
2η εβδομάδα (Διάλεξη): Εξόρυξη γνώσης και επιχειρηματική ευφυΐα. Η διαδικασία της εξόρυξης γνώσης. Προετοιμασία δεδομένων. Προσαρμογή δεδομένων. Εξαγωγή χαρακτηριστικών. Διαχείριση πολυδιάστατων δεδομένων. Μείωση δεδομένων.
3η εβδομάδα (Διάλεξη): Επιβλεπόμενη/Μη επιβλεπόμενη/Μερικώς επιβλεπόμενη μάθηση. Κατηγοριοποίηση. Τεχνικές. Αλγόριθμοι. Μετρικές ομοιότητας/απόστασης. Αξιολόγηση αποτελεσμάτων. Δέντρα ταξινόμησης, νευρωνικά δίκτυα, support vector machines. Στατιστική παλινδρόμηση και πρόβλεψη.
4η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Προετοιμασία δεδομένων, τεχνικές και αλγόριθμοι κατηγοριοποίησης, μέτρα ποιότητας.
5η εβδομάδα (Διάλεξη): Συσταδοποίηση. Τεχνικές. Αλγόριθμοι. Αξιολόγηση αποτελεσμάτων. Περιγραφή συστάδων. Διερεύνηση των δεδομένων (οπτικοποίηση).
6η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Προετοιμασία δεδομένων, τεχνικές και αλγόριθμοι συσταδοποίησης. Μείωση διαστάσεων.
7η εβδομάδα (Διάλεξη): Κανόνες συσχέτισης. Τεχνικές. Αλγόριθμοι. Αξιολόγηση αποτελεσμάτων. Χρονοσειρές. Ακολουθιακά πρότυπα.
8η εβδομάδα (Διάλεξη): Αποθήκες δεδομένων. Ποιότητα δεδομένων. Κύβοι και πολυδιάστατη ανάλυση δεδομένων. Ιεραρχίες εννοιών και προβολές διαστάσεων.
9η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Διαχείριση αποθήκης δεδομένων.
10η εβδομάδα (Διάλεξη/Επίδειξη): Μελέτη περίπτωσης. Εξόρυξη γνώσης από ιατρικά δεδομένα.
11η εβδομάδα (Διάλεξη/Επίδειξη): Μελέτη περίπτωσης. Εξόρυξη γνώσης από δεδομένα στον ιστό.
12η εβδομάδα: Παρουσίαση εργασιών