Μαθησιακά Αποτελέσματα
Οι σύγχρονες εφαρμογές στο διαδίκτυο έχουν δημιουργήσει την ανάγκη της καθημερινής διαχείρισης τεράστιων ποσοτήτων δεδομένων. Η επαναλαμβανόμενη εκτέλεση υπολογιστικών διεργασιών σε ποσότητες δεδομένων που δεν χωρούν στην μνήμη, δεν είναι εύκολο να αντιμετωπιστεί με παραδοσιακές τεχνικές. Το μάθημα προσφέρει στους σπουδαστές τις απαραίτητες γνώσεις και δεξιότητες που απαιτούνται για την επίλυση προβλημάτων που αφορούν μεγάλου όγκου δεδομένων που δεν χωρούν στην μνήμη. Κάθε ενότητα του μαθήματος αποτελείται από δύο μέρη. Στο πρώτο μέρος περιγράφεται η αρχιτεκτονική σύγχρονων κατανεμημένων συστημάτων διαχείρισης μεγάλου όγκου δεδομένων και στο δεύτερο μέρος περιγράφονται αλγοριθμικές τεχνικές. Όλα τα παραδείγματα βασίζονται σε μελέτες περιπτώσεων με την χρήση εργαλείων ανοικτού κώδικα.
Περιεχόμενο Μαθήματος
1η εβδομάδα (Διάλεξη): Εισαγωγή σε μεγάλου όγκου δεδομένα. Σύγχρονα υπολογιστικά μοντέλα. Σύγχρονα μοντέλα αποθήκευσης.
2η εβδομάδα (Διάλεξη): Εισαγωγή σε σύγχρονα κατανεμημένα συστήματα.
3η εβδομάδα (Διάλεξη): Κατανεμημένα συστήματα αρχείων μεγάλης κλίμακας και η πλατφόρμα Map-Reduce για παράλληλους υπολογισμούς.
4η εβδομάδα (Διάλεξη): Βασικοί αλγόριθμοι με Map-Reduce: πολλαπλασιασμός πινάκων, σχεσιακή άλγεβρα. Υψηλού επιπέδου γλώσσες για ανάλυση δεδομένων.
5η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Το σύστημα Hadoop.
6η εβδομάδα (Διάλεξη): Αρχιτεκτονική του συστήματος Spark και υλοποίηση αλγορίθμων με RDDs.
7η εβδομάδα (Εργαστήριο): Πρακτική εφαρμογή. Το σύστημα Spark.
8η εβδομάδα (Διάλεξη): Σύγχρονα κατανεμημένα μη-σχεσιακά αποθετήρια δεδομένων I. BASE Consistency, CAP Theorem, BigTable
9η εβδομάδα (Διάλεξη): Σύγχρονα κατανεμημένα μη-σχεσιακά αποθετήρια δεδομένων II. Dynamo, PNUTS
10η εβδομάδα (Διάλεξη): Σύγχρονα κατανεμημένα συστήματα για την αποθήκευση γραφημάτων. Vertex-Centric, BSP, Gas Model.
11η εβδομάδα: Παρουσίαση εργασιών φοιτητών.
12η εβδομάδα: Παρουσίαση εργασιών φοιτητών.