Εξόρυξη Δεδομένων και Επιχειρηματική Ευφυΐα

Course ID
ΠΜΣ03
Κατεύθυνση
Εξάμηνο
Χειμερινό
Τύπος
Υποχρεωτικό 1ης κατεύθ.

Μαθησιακά Αποτελέσματα

Η εξόρυξη γνώσης από δεδομένα αφορά τη διαδικασία επιλογής, διερεύνησης και ανάλυσης μεγάλου όγκου δεδομένων, με στόχο την ανακάλυψη προτύπων και κανόνων που εμφανίζουν ιδιαίτερο ενδιαφέρον. Η διαδικασία αυτή μετατρέπει τα απλά δεδομένα σε χρήσιμη γνώση, η οποία είναι απαραίτητη για τη λήψη αποφάσεων σχεδόν σε κάθε οργανισμό.
Το μάθημα προσφέρει στους σπουδαστές τις απαραίτητες γνώσεις και δεξιότητες που απαιτούνται για την μετατροπή των δεδομένων σε επιχειρηματική ευφυΐα. Αυτό γίνεται σταδιακά: αρχικά με την παρουσίαση των βασικών τεχνικών που συναντούνται στη βιβλιογραφία, όπως η ταξινόμηση, η συσταδοποίηση, η εύρεση κανόνων συσχέτισης κλπ, στη συνέχεια με την πρακτική εφαρμογή των πιο δημοφιλών αλγορίθμων και τεχνικών σε σύνολα δεδομένων με τη χρήση εργαλείων ανοικτού κώδικα και εμπορικών εφαρμογών και τέλος με τη μελέτη περιπτώσεων που παρουσιάζουν αυξημένο ερευνητικό και επιχειρηματικό ενδιαφέρον στις μέρες μας.

Περιεχόμενο Μαθήματος

Η φιλοσοφία των Συστημάτων Υποστήριξης Αποφάσεων (ΣΥΑ) και ο ρόλος τους στις διαδικασίες λήψης αποφάσεων στην επιχείρηση. Εξόρυξη γνώσης και επιχειρηματική ευφυΐα.
Επιβλεπόμενη/Μη επιβλεπόμενη/Μερικώς επιβλεπόμενη μάθηση. Προετοιμασία δεδομένων. Κατηγοριοποίηση. Συσταδοποίηση. Κανόνες συσχέτισης και ακολουθιακά πρότυπα.
Αποθήκες δεδομένων, OLAP. Διαχείριση δεδομένων σε Ν-διαστάσεις. Ιεραρχίες διαστάσεων και υπερκύβοι, Σχεσιακά και πολυδιάστατα μοντέλα., Εργαλεία για εξόρυξη γνώσης – συγκριτική παρουσίαση.
Εξόρυξη δεδομένων από κείμενα. Εξόρυξη δεδομένων από το web. Εξόρυξη γνώσης από δεδομένα αγορών. Εξόρυξη γνώσης από ιατρικά και βιολογικά δεδομένα.

1η εβδομάδα (Διάλεξη): Εισαγωγή στη θεωρία Αποφάσεων. Τύποι αποφάσεων και προσεγγίσεις. Ο ρόλος των Συστημάτων Υποστήριξης Αποφάσεων (ΣΥΑ) στις διαδικασίες λήψης αποφάσεων στην επιχείρηση. Διαθέσιμες λύσεις και αρχιτεκτονικές. Τα στάδια ανάπτυξης ενός συστήματος επιχειρηματικής ευφυΐας.
2η εβδομάδα (Διάλεξη): Εξόρυξη γνώσης και επιχειρηματική ευφυΐα. Η διαδικασία της εξόρυξης γνώσης. Προετοιμασία δεδομένων. Προσαρμογή δεδομένων. Εξαγωγή χαρακτηριστικών. Διαχείριση πολυδιάστατων δεδομένων. Μείωση δεδομένων.
3η εβδομάδα (Διάλεξη): Επιβλεπόμενη/Μη επιβλεπόμενη/Μερικώς επιβλεπόμενη μάθηση. Κατηγοριοποίηση. Τεχνικές. Αλγόριθμοι. Μετρικές ομοιότητας/απόστασης. Αξιολόγηση αποτελεσμάτων. Δέντρα ταξινόμησης, νευρωνικά δίκτυα, support vector machines. Στατιστική παλινδρόμηση και πρόβλεψη.
4η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Προετοιμασία δεδομένων, τεχνικές και αλγόριθμοι κατηγοριοποίησης, μέτρα ποιότητας.
5η εβδομάδα (Διάλεξη): Συσταδοποίηση. Τεχνικές. Αλγόριθμοι. Αξιολόγηση αποτελεσμάτων. Περιγραφή συστάδων. Διερεύνηση των δεδομένων (οπτικοποίηση).
6η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Προετοιμασία δεδομένων, τεχνικές και αλγόριθμοι συσταδοποίησης. Μείωση διαστάσεων.
7η εβδομάδα (Διάλεξη): Κανόνες συσχέτισης. Τεχνικές. Αλγόριθμοι. Αξιολόγηση αποτελεσμάτων. Χρονοσειρές. Ακολουθιακά πρότυπα.
8η εβδομάδα (Διάλεξη): Αποθήκες δεδομένων. Ποιότητα δεδομένων. Κύβοι και πολυδιάστατη ανάλυση δεδομένων. Ιεραρχίες εννοιών και προβολές διαστάσεων.
9η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Διαχείριση αποθήκης δεδομένων.
10η εβδομάδα (Διάλεξη/Επίδειξη): Μελέτη περίπτωσης. Εξόρυξη γνώσης από ιατρικά δεδομένα.
11η εβδομάδα (Διάλεξη/Επίδειξη): Μελέτη περίπτωσης. Εξόρυξη γνώσης από δεδομένα στον ιστό.
12η εβδομάδα: Παρουσίαση εργασιών

ΓΕΝΙΚΕΣ ΙΚΑΝΟΤΗΤΕΣ

Προσαρμογή σε νέες καταστάσεις

Λήψη αποφάσεων

Αυτόνομη Εργασία

Ομαδική Εργασία

Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης

ΔΙΔΑΚΤΙΚΕΣ ΚΑΙ ΜΑΘΗΣΙΑΚΕΣ ΜΕΘΟΔΟΙ - ΑΞΙΟΛΟΓΗΣΗ

Τρόπος Παρακολούθησης: Δια ζώσης, Εξ αποστάσεως εκπαίδευση
Χρήση Τεχνολογιων Πληροφορίας και Επικοινωνιών: eclass, estudie

Δραστηριότητα Φόρτος Εργασίας
Εξαμήνου
Παρακολούθηση διαλέξεων 30
Εργαστηριακή Άσκηση 9
Ατομικές ή Ομαδικές Εργασίες 32
Αυτοτελής μελέτη 79
Σύνολο 150

ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ

Γραπτή τελική εξέταση (60%) που περιλαμβάνει:
– Ερωτήσεις πολλαπλής επιλογής
– Επίλυση προβλημάτων
– Συγκριτική αξιολόγηση στοιχείων θεωρίας

  Ομαδικές Εργασίες που αξιολογούνται σε δύο στάδια (40%): περιγραφή της προτεινόμενης προσέγγισης, υλοποίηση.

ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ

Carlo Vercellis. “Business Intelligence: Data Mining and Optimization for Decision Making” Wiley. 2009
Charu Aggarwal, ChengXiang Zhai “Mining Text Data”, Springer 2012.
Bing Liu, “Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data (Data-Centric Systems and Applications)”, Springer 2008.
Ian Witten, Eibe Frank, “Data Mining, Practical machine learning tools and techniques” Elsevier, Morgan Kaufmann, 2005
Rob Sullivan, “Introduction to Data Mining for the Life Science”. Springer 2012.
Robert Stackowiak, Joseph Rayman, Rick Greenwald. “Oracle Data Warehousing and Business Intelligence Solutions”, Wiley, 2007
Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Elsevier, Morgan Kaufmann, 2006

International Journal of Business Intelligence and Data Mining, ACM
IEEE Transactions on Knowledge and Data Engineering
International Journal of Data Science and Analytics, Springer
Data Mining and Knowledge Discovery, Springer
Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery