Πέμπτη 14 Δεκεμβρίου 2017

AlphaZero, το μέλλον είναι εδώ – Οι μηχανές αυτοδιδάσκονται

 

 Υποστήκαμε το πρώτο σοκ το 1997, όταν ο ισχυρότερος σκακιστής του αιώνα, ο Γκάρι Κασπάροβ, ηττήθηκε στη Νέα Υόρκη από τον υπερυπολογιστή Deep Blue. Η δυσκολία να συνειδητοποιήσουμε το γεγονός οδηγούσε σε εκδοχές και υποψίες σκοπιμοτήτων και χρηματισμού. Έκτοτε, οι νίκες των μηχανών σε συναντήσεις με διάσημους γκραν μετρ έδωσαν την αποστομωτική απάντηση. Την αναστάτωση ήρθε να διασκεδάσει φλεγματικός Άγγλος γκραν μετρ, λέγοντας ότι και ένα γκρέιντερ σηκώνει περισσότερο από τον παγκόσμιο πρωταθλητή άρσης βαρών.

Στα 20 χρόνια που ακολούθησαν, οι μηχανές εξελίχθηκαν ραγδαία. Το καμάρι του σκακιστικού προγραμματισμού, το Stockfish, έφθασε να υπολογίζει εβδομήντα εκατομμύρια κινήσεις ανά δευτερόλεπτο. Φάνταζε άτρωτο!

Ο ιθύνων νους Ντ. Χασάμπης


Το 2014 η Google αποκτά έναντι 450 εκατομμυρίων ευρώ το πρωτοποριακό βρετανικό εργαστήριο τεχνητής νοημοσύνης DeepMind. Συνιδρυτής και ιθύνων νους ο Ελληνοκύπριος Ντέμης Χασάμπης, ο, κατά τον Γκάρντιαν, «υπερήρωας της τεχνητής νοημοσύνης».

Ο Χασάμπης, γεννημένος το 1976 στο Λονδίνο από Ελληνοκύπριο πατέρα (καταγόμενο από την Αμμόχωστο) και μητέρα από τη Σιγκαπούρη, διακρίνεται από μικρός σε σκακιστικούς αγώνες. Με το πρώτο χρηματικό έπαθλο αγοράζει ένα κομπιούτερ και εκείνο που τον μαγεύει είναι το ότι μπορεί να το προγραμματίζει!

Το 1997, πτυχιούχος του Κέιμπριτζ, εργάζεται σε δημιουργικό στούντιο ηλεκτρονικών παιχνιδιών. Το 2010 ιδρύει την DeepMind. Το πρόγραμμά του, το AlphaGo, κερδίζει τον παγκόσμιο πρωταθλητή στο γκο, στο κινεζικό επιτραπέζιο παιχνίδι των 3.000 ετών!

Δεν ξαφνιάζει τόσο το αποτέλεσμα όσο το γεγονός ότι το AlphaGo μαθαίνει μόνο του, με τον ίδιο τρόπο που το κάνει ο ανθρώπινος εγκέφαλος.

Πριν από λίγες ημέρες, το δημιούργημα του σκακιστή Ντέμη Χασάμπη, το AlphaZero, αντιμετωπίζει σε ματς 100 παρτίδων το Stockfish 8. Το αποτέλεσμα είναι πέρα από κάθε πρόβλεψη: 28-0 και 72 ισοπαλίες υπέρ του AlphaZero. Είναι χαρακτηριστικό ότι οι 25 νίκες σημειώθηκαν με τα λευκά!

Το AlphaZero υπολογίζει ογδόντα χιλιάδες κινήσεις το δευτερόλεπτο (δηλαδή είναι 900 φορές πιο αργό από το Stockfish!), αλλά έτρεχε σε κατά 4 φορές ισχυρότερο hardware.

Όπως γράφει ο Φίλιππος Κοεράντ, «το εντυπωσιακό είναι πως η μηχανή αυτή (AlphaZero) ‘δεν ήξερε σκάκι’ τέσσερις ώρες πριν αρχίσει η αναμέτρηση (ενώ το Stockfish ‘χτίζεται’ ασταμάτητα επί πολλά χρόνια, με αφοσίωση ζωής, από πλήθος προγραμματιστών). Ο νέος επισκέπτης δεν πατάει σε κλασικό προγραμματισμό με αλγορίθμους, με σχετικές εκτιμήσεις δυναμικότητας κομματιών στις θέσεις, με δυναμικές εκτιμήσεις για τις πιονοδομές, με βιβλία ανοιγμάτων, με πίνακες φινάλε κ.λπ., αλλά στην τεχνητή νοημοσύνη. Το AlphaZero ‘έμαθε σκάκι’ από την αρχή και με την αυτοδιδαχή, σε λιγότερη ώρα από όση καταναλώνει κανείς για να δει τον Άρχοντα των Δαχτυλιδιών, κέρδισε με σαρωτική διαφορά στο σκορ και χωρίς ήττα την κορυφαία κλασικού προγραμματισμού μηχανή του κόσμου». Συμπεραίνει πως «μάλλον ο προγραμματισμός των σκακιστικών μηχανών θα αποτελέσει ρομαντικό παρελθόν και το σύντομο μέλλον, το πολύ σύντομο μέλλον, ανήκει στην τεχνητή νοημοσύνη» και καταλήγει: «Ζώντας το παρόν δεν υπάρχει ανθρώπινη δυνατότητα να συλλάβει κανείς πότε μιλάμε για εξέλιξη και πότε για τομή. Και πόση ιστορία πίσω από τη σκηνή έχει η τομή πριν εμφανιστεί στο κοινό».

Ο Παναγιώτης Κονιδάρης αναφέρει σε σχόλιό του: «Μου μοιάζει συγκλονιστικό. Όχι ‘καλό’ ή ‘κακό’. Συγκλονιστικό! Κάτι μου ψιθυρίζει ότι γύρισε μια ιστορική σελίδα καθώς κοιμόμασταν. Όχι για το σκάκι βέβαια, αστεία πράματα. Αυτό δεν ήταν παρά ο πειραματικός θάλαμος ή ένα μικρό μέσο επίδειξης. Όμως μια Α.Ι. που μπορεί να αυτοδιδάσκεται και να αυτοβελτιώνεται, είναι κάτι ταυτόχρονα θαυμάσιο και τρομακτικό».


ΠΗΓΗ: http://antikleidi.com/2017/12/12/the-future-is-here-alphazero-learns-chess/

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου