Τεχνητό νευρωνικό δίκτυο
Ίων Ανδρουτσόπουλος
Καθηγητής Τμήματος Πληροφορικής Οικονομικού Πανεπιστημίου Αθηνών
Η τεχνητή νοημοσύνη αναπτύσσει υπολογιστικά συστήματα τα οποία επιχειρούν να λύσουν προβλήματα ή να εκτελέσουν εργασίες που συνήθως θεωρούμε πως απαιτούν νοημοσύνη. Παραδείγματα τέτοιων προβλημάτων είναι η απόδειξη μαθηματικών θεωρημάτων, η οδήγηση αυτοκινήτων, η κατανόηση φυσικής γλώσσας. Η τεχνητή νοημοσύνη χρησιμοποιεί ιδέες από πολλές επιστήμες, όπως η βιολογία, τα μαθηματικά, η γλωσσολογία, οι οικονομικές επιστήμες, αλλά ως κλάδος της πληροφορικής μελετάται από τη δεκαετία του 1950. Μάλιστα, πολλοί από τους θεμελιωτές της σύγχρονης πληροφορικής, όπως ο Alan Turing, ήταν και πρωτοπόροι της τεχνητής νοημοσύνης. Η τεχνητή νοημοσύνη έχει περάσει περιόδους υπεραισιόδοξων εκτιμήσεων του τι θα μπορούσε να καταφέρει, αλλά και «χειμώνες», περιόδους στις οποίες πολύ λίγοι πίστευαν πλέον στις δυνατότητές της. Σήμερα διανύουμε περίοδο έντονης αισιοδοξίας, που οφείλεται κυρίως στις επιδόσεις συστημάτων που χρησιμοποιούν μηχανική μάθηση, και ιδιαίτερα «βαθιά μάθηση», μια μορφή τεχνητών νευρωνικών δικτύων.
Σήμερα επικρατεί έντονη αισιοδοξία για τις επιδόσεις συστημάτων που χρησιμοποιούν «βαθιά μάθηση», μια μορφή τεχνητών νευρωνικών δικτύων.
Οι αλγόριθμοι μηχανικής μάθησης επιτρέπουν στους υπολογιστές να μαθαίνουν οι ίδιοι πώς να εκτελούν μια εργασία. Για παράδειγμα, ένα σύστημα αυτόματης οδήγησης εκπαιδεύεται σε δεδομένα του παρελθόντος που δείχνουν τι «έβλεπαν» οι κάμερες του αυτοκινήτου και άλλοι αισθητήρες όσο οδηγούσαν άνθρωποι, μαζί με τις ενέργειες των οδηγών (π.χ. προς τα πού έστριβαν το τιμόνι, πόσο πατούσαν το γκάζι). Από τα δεδομένα αυτά, το σύστημα μαθαίνει να μιμείται τη συμπεριφορά των ανθρώπων-οδηγών.
Στην περίπτωση ενός απλοϊκού νευρωνικού δικτύου (βλ. εικόνα), οι ενδείξεις των αισθητήρων θα ήταν οι είσοδοι x1,…,xn του δικτύου και οι έξοδοι y1,…,yk θα έλεγχαν το τιμόνι, το γκάζι κ.λπ. Ο κάθε κόμβος του δεύτερου και τρίτου στρώματος (z, y) είναι ένας τεχνητός νευρώνας. Υπολογίζει ένα ζυγισμένο άθροισμα των εισόδων του, εφαρμόζοντας κατόπιν στο άθροισμα μια μη γραμμική συνάρτηση (f, g). Τα βάρη του δικτύου (w, u) προσαρμόζονται κατά την εκπαίδευση, ώστε οι αποκρίσεις του δικτύου να πλησιάζουν τις επιθυμητές (τις ενέργειες των ανθρώπων-οδηγών). Αντίστοιχα, σε ένα σύστημα εξόρυξης γνώμης, οι είσοδοι (x) θα παρίσταναν π.χ. το κείμενο ενός tweet και οι έξοδοι (y) το πόσο θετική ή αρνητική γνώμη εκφράζει το tweet.
Η βαθιά μάθηση χρησιμοποιεί πολύ περισσότερα στρώματα νευρώνων με πολύ πιο περίπλοκες διατάξεις, αλλά η βασική ιδέα παραμένει η ίδια.