– δημοσίευσε την επιδραστική εργασία ” On the Measure of Intelligence ” όπου εισήγαγε το “Abstract and Reasoning Corpus for Artificial General Intelligence” ( ARC-AGI) σημείο αναφοράς για τη μέτρηση της αποτελεσματικότητας της απόκτησης δεξιοτήτων AI σε άγνωστο καθήκοντα.
Στις 20 Δεκεμβρίου, το σύστημα o3 του OpenAI σημείωσε 85% στο σημείο αναφοράς ARC-AGI , πολύ πάνω από την προηγούμενη καλύτερη βαθμολογία AI του 55% και στο ίδιο επίπεδο με τη μέση βαθμολογία για τον άνθρωπο. Επίσης, σημείωσε καλή βαθμολογία σε ένα πολύ δύσκολο τεστ μαθηματικών.
Η δημιουργία τεχνητής γενικής νοημοσύνης, ή AGI, είναι ο δεδηλωμένος στόχος όλων των μεγάλων ερευνητικών εργαστηρίων AI. Με την πρώτη ματιά, το OpenAI φαίνεται να έχει κάνει τουλάχιστον ένα σημαντικό βήμα προς αυτόν τον στόχο.
Ενώ ο σκεπτικισμός παραμένει, πολλοί ερευνητές και προγραμματιστές τεχνητής νοημοσύνης αισθάνονται ότι κάτι έχει αλλάξει. Για πολλούς, η προοπτική του AGI φαίνεται πλέον πιο πραγματική, επείγουσα και πιο κοντινή από ό,τι αναμενόταν. Έχουν δίκιο;
Για να κατανοήσετε τι σημαίνει το αποτέλεσμα o3, πρέπει να καταλάβετε τι είναι το τεστ ARC-AGI. Σε τεχνικούς όρους, είναι μια δοκιμή της «αποτελεσματικότητας δείγματος» ενός συστήματος AI στην προσαρμογή σε κάτι νέο – πόσα παραδείγματα μιας νέας κατάστασης πρέπει να δει το σύστημα για να καταλάβει πώς λειτουργεί.
Ένα σύστημα τεχνητής νοημοσύνης όπως το ChatGPT (GPT-4) δεν είναι πολύ αποδοτικό ως δείγμα. «Εκπαιδεύτηκε» σε εκατομμύρια παραδείγματα ανθρώπινου κειμένου, κατασκευάζοντας πιθανολογικούς «κανόνες» σχετικά με το ποιοι συνδυασμοί λέξεων είναι πιο πιθανοί.
Το αποτέλεσμα είναι πολύ καλό σε κοινές εργασίες. Είναι κακό σε ασυνήθιστες εργασίες, επειδή έχει λιγότερα δεδομένα (λιγότερα δείγματα) για αυτές τις εργασίες.
Έως ότου τα συστήματα τεχνητής νοημοσύνης μπορούν να μάθουν από μικρό αριθμό παραδειγμάτων και να προσαρμοστούν με μεγαλύτερη αποτελεσματικότητα δειγμάτων, θα χρησιμοποιούνται μόνο για πολύ επαναλαμβανόμενες εργασίες και εκείνες όπου η περιστασιακή αποτυχία είναι ανεκτή.
Η ικανότητα επίλυσης με ακρίβεια προηγουμένως άγνωστων ή νέων προβλημάτων από περιορισμένα δείγματα δεδομένων είναι γνωστή ως ικανότητα γενίκευσης. Θεωρείται ευρέως απαραίτητο, ακόμη και θεμελιώδες, στοιχείο ευφυΐας.
Αυτά μοιάζουν πολύ με τα τεστ IQ που μερικές φορές μπορεί να θυμάστε από το σχολείο.
Δεν γνωρίζουμε ακριβώς πώς το έχει κάνει το OpenAI, αλλά τα αποτελέσματα δείχνουν ότι το μοντέλο o3 είναι εξαιρετικά προσαρμόσιμο. Από μερικά μόνο παραδείγματα, βρίσκει κανόνες που μπορούν να γενικευτούν.
Γνωρίζουμε ότι το OpenAI ξεκίνησε με μια έκδοση γενικής χρήσης του μοντέλου o3 (η οποία διαφέρει από τα περισσότερα άλλα μοντέλα, επειδή μπορεί να αφιερώσει περισσότερο χρόνο στο να «σκέφτεται» για δύσκολες ερωτήσεις) και στη συνέχεια το εκπαίδευσε ειδικά για τη δοκιμή ARC-AGI.
Ο Γάλλος ερευνητής τεχνητής νοημοσύνης Francois Chollet, ο οποίος σχεδίασε το σημείο αναφοράς, πιστεύει ότι το o3 αναζητά μέσα από διαφορετικές «αλυσίδες σκέψης» που περιγράφουν βήματα για την επίλυση της εργασίας.
Αυτό που ακόμα δεν ξέρουμε
Το ερώτημα λοιπόν είναι, είναι αυτό πραγματικά πιο κοντά στο AGI; Εάν έτσι λειτουργεί το o3, τότε το υποκείμενο μοντέλο μπορεί να μην είναι πολύ καλύτερο από τα προηγούμενα μοντέλα.
Σχεδόν τα πάντα σχετικά με το o3 παραμένουν άγνωστα. Το OpenAI έχει περιορίσει την αποκάλυψη σε λίγες παρουσιάσεις μέσων και πρώιμες δοκιμές σε λίγους ερευνητές, εργαστήρια και ιδρύματα ασφάλειας τεχνητής νοημοσύνης.
Η αληθινή κατανόηση των δυνατοτήτων του o3 θα απαιτήσει εκτεταμένη εργασία, συμπεριλαμβανομένων αξιολογήσεων, κατανόησης της κατανομής των δυνατοτήτων του, πόσο συχνά αποτυγχάνει και πόσο συχνά πετυχαίνει.
Όταν το o3 κυκλοφορήσει τελικά, θα έχουμε μια πολύ καλύτερη ιδέα για το αν είναι περίπου τόσο προσαρμόσιμο όσο ένας μέσος άνθρωπος.
Αν ναι, θα μπορούσε να έχει τεράστιο, επαναστατικό, οικονομικό αντίκτυπο, εγκαινιάζοντας μια νέα εποχή αυτοβελτιούμενης επιταχυνόμενης νοημοσύνης. Θα χρειαστούμε νέα σημεία αναφοράς για το ίδιο το AGI και σοβαρή εξέταση του τρόπου με τον οποίο θα πρέπει να διοικείται.
Αν όχι, τότε αυτό θα εξακολουθεί να είναι ένα εντυπωσιακό αποτέλεσμα. Ωστόσο, η καθημερινότητα θα παραμείνει σχεδόν ίδια.
photo: pixabay