
Οι προγραμματιστές και οι ηγέτες ανοιχτού κώδικα και τεχνητής νοημοσύνης (AI) συμφωνούν ότι η τεχνητή νοημοσύνη ανοιχτού κώδικα είναι σημαντική. Παρά τις καλύτερες προσπάθειες της Πρωτοβουλίας Ανοικτού Κώδικα (OSI) να δημιουργήσει έναν ορισμό τεχνητής νοημοσύνης ανοιχτού κώδικα (OSAID), εξακολουθεί να υπάρχει μεγάλη διαφωνία σχετικά με το τι πρέπει και τι δεν πρέπει να περιλαμβάνεται στο OSAID. Ως αποτέλεσμα αυτής της διαμάχης, η νεοσύστατη Συμμαχία Ανοικτού Κώδικα (OSA) δημοσίευσε την άποψή της για το OSAID: Open Weight Definition (OWD).
Το OWD είναι ένα νέο πλαίσιο που εξισορροπεί την ακεραιότητα της τεχνητής νοημοσύνης κλειστού και ανοιχτού κώδικα. Σύμφωνα με τους δημιουργούς του, αυτό το πλαίσιο έχει σχεδιαστεί για να επιλύει τις πολυπλοκότητες και τα προβλήματα που προκύπτουν από την ταχεία ανάπτυξη των τεχνολογιών τεχνητής νοημοσύνης. Στόχος του είναι να παρέχει ένα σαφές πρότυπο για το τι συνιστά «ανοιχτό κώδικα» σε μοντέλα τεχνητής νοημοσύνης, ειδικά μοντέλα μεγάλων γλωσσών (LLM).
Επίσης: Το νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα της DeepSeek θα μπορούσε να νικήσει το o1 με ένα κλάσμα του κόστους.
Τα βάρη είναι θεμελιώδη στοιχεία της τεχνητής νοημοσύνης. Με βάση τα πρωτογενή δεδομένα, τα βάρη είναι αριθμητικές τιμές που σχετίζονται με συνδέσεις μεταξύ κόμβων σε διαφορετικά επίπεδα ενός προγράμματος AI. Αυτές οι τιμές καθορίζονται κατά τη διαδικασία εκπαίδευσης μηχανικής εκμάθησης. Συγκεκριμένα, το OWD περιλαμβάνει:
- Διαθεσιμότητα Βάρος Μοντέλου: Ο ορισμός δίνει έμφαση στο να γίνουν τα βάρη μοντέλων προσβάσιμα σε προγραμματιστές και ερευνητές.
- Πληροφορίες συνόλου δεδομένων: Αν και ο ορισμός δεν απαιτεί πλήρη πρόσβαση στα δεδομένα εκπαίδευσης, υπογραμμίζει την ανάγκη για λεπτομερείς πληροφορίες σχετικά με το περιεχόμενο του συνόλου δεδομένων και τις μεθόδους συλλογής.
- Διαφάνεια αρχιτεκτονικής: Το πλαίσιο ενθαρρύνει την αποκάλυψη πληροφοριών αρχιτεκτονικής μοντέλων για τη διευκόλυνση βελτιώσεων και τροποποιήσεων.
Η Amanda Brock, Διευθύνουσα Σύμβουλος του OpenUK, δήλωσε για την υποστήριξη του OWD: «Η Συμμαχία στοχεύει να αυξήσει τη συνεργασία μεταξύ των πολλαπλών οργανισμών που ανταγωνίζονται επί του παρόντος για την καλύτερη παγκόσμια συνεργασία. Αυτό το πρώτο βήμα κοινής χρήσης μιας προσέγγισης για τον καθορισμό των ανοιχτών βαρών συνάδει με την κατανομή της τεχνητής νοημοσύνης και τον καθορισμό του επιπέδου διαφάνειας ενός ομαδοποιημένου αλλά σημαντικού στοιχείου, είτε πρόκειται για δεδομένα, βάρος ή μοντέλο… Σίγουρα φαίνεται πιο πρακτικό και λειτουργικό παρά μια μικρή ομάδα που δημιουργεί έναν ορισμό που δεν ταιριάζει με τους στόχους. “
Αυτό το τελευταίο σχόλιο αφορούσε το OSAID OSI, στο οποίο ο Brock ήταν αντίθετος. Πράγματι, η OSA έχει αδράξει το ζήτημα της τεχνητής νοημοσύνης ανοιχτού κώδικα για να προσπαθήσει να αντικαταστήσει το OSI. Τον Ιανουάριο, ο ιδρυτής Sam Johnston δήλωσε σε ένα δελτίο τύπου: «Τα δεδομένα δοκίμασαν τα όρια του ορισμού ανοιχτού κώδικα (OSD), ο οποίος έχει αποδειχθεί ανοιχτός, αλλά στερείται πληρότητας πέρα από τα στοιχεία του πηγαίου κώδικα». Με την προσθήκη του OWD στο OSD, η Johnston θέλει να δημιουργήσει μια έκδοση ανοιχτού κώδικα 2.0.
Επίσης: o1 OpenAI βρίσκεται περισσότερο από οποιοδήποτε σημαντικό μοντέλο AI. Γιατί είναι σημαντικό αυτό
Ο Μπροκ πρόσθεσε ότι παρά τη δημοσίευση του ορισμού του OSAID τον περασμένο Οκτώβριο, «το OSI είναι «στα πρώτα χρόνια» με αυτόν τον ορισμό. Κατά τη γνώμη μου, αυτό δείχνει ότι η προσέγγιση για τον ορισμό της «τεχνητής νοημοσύνης ανοιχτού κώδικα» είναι εσφαλμένη. Αντίθετα, θα πρέπει να ακολουθήσουμε αυτήν την αποσπασματική προσέγγιση του προβλήματος και να εξετάσουμε την υποκείμενη «τεχνολογία», συμπεριλαμβανομένων των δεδομένων εκπαίδευσης, και τι σημαίνει να είσαι ανοιχτός. Ο ανοιχτός κώδικας δεν ορίζει το νόμο και δεν πρέπει να ορίζει τι εξουσιοδοτεί τον καθένα. χρησιμοποιήστε την τεχνολογία πηγής, συμπεριλαμβανομένων των δεδομένων, για οποιονδήποτε σκοπό.”
Ο Brock κατέληξε: «Κατά την αξιολόγηση του κινδύνου και της ευθύνης, είναι απαραίτητο να κατανοήσουμε την πραγματικότητα και την ακρίβεια αυτού. Ως εκ τούτου, η σημερινή ανακοίνωση της Συμμαχίας για τον καθορισμό του ανοιχτού βάρους είναι πολυαναμενόμενη».
Σε απάντηση στη δήλωση του OWD, ο Stefano Maffulli, εκτελεστικός διευθυντής του OSI, είπε: «Οι κοινότητες δημιουργούν πρότυπα και ορισμούς. Το Linux Foundation έχει ήδη έναν ορισμό των ανοιχτών βαρών στο Model Openness Framework.”
Το Linux Foundation δεν είναι ο μόνος οργανισμός που εργάζεται για την τυποποίηση των ανοιχτών βαρών. Επικοινώνησε επίσης μαζί τους η διάσημη δικηγόρος ανοιχτού κώδικα Heather Meeker. Ο Meeker έγραψε: «Υπάρχει μια θεμελιώδης παρεξήγηση στον τομέα της τεχνητής νοημοσύνης που πρέπει να αντιμετωπιστεί – η υπόθεση ότι οι αρχές αδειοδότησης λογισμικού ανοιχτού κώδικα μπορούν να ισχύουν άμεσα για τα νευρωνικά καθαρά βάρη (NNWs). Η παρανόηση προκύπτει από τη συγχώνευση δύο διαφορετικών τεχνουργημάτων. — πηγαίος κώδικας λογισμικού και NNW.”
Επίσης, πέρασα ώρες δοκιμάζοντας το ChatGPT Tasks και η άρνησή του να ακολουθήσει τις οδηγίες ήταν λίγο τρομακτική.
Και συνέχισε: «Το NNW είναι διαφορετικό. Αντιπροσωπεύουν τη «γνώση» που μαθαίνεται από το τεχνητό νευρωνικό δίκτυο και συχνά αποθηκεύονται ως μεγάλοι αριθμητικοί πίνακες. Σε αντίθεση με τον πηγαίο κώδικα, το NNW δεν είναι αναγνώσιμο από τον άνθρωπο και δεν μπορεί να εντοπιστεί σφάλματα. […] Οι βασικές ελευθερίες του ανοιχτού κώδικα – για εκτέλεση, μελέτη, διανομή και τροποποίηση λογισμικού – δεν μεταφράζονται εύκολα σε NNW. Ενώ μπορείτε να εκτελέσετε και να διανείμετε NNW, η εκμάθηση και η τροποποίηση τους δεν είναι ασήμαντη ή λειτουργικά αδύνατη».
Μπορείτε να κάνετε κοινή χρήση του NWW με άδεια ανοιχτού κώδικα, την προτεινόμενη άδεια Open Weights Permissive License του Meeker. Όμως, όπως σημείωσε, «Αντίθετα, αυτός ο ορισμός εστιάζει στην αρχική ιδέα της διαφάνειας και της διατήρησης των αρχικών στόχων του Freedom Zero: ελεύθερο λογισμικό και ανοιχτό κώδικα».
Ο Muffley είπε: «Το TheOSI εξετάζει τι κάνουν στην πραγματικότητα οι άνθρωποι τεχνητής νοημοσύνης. Όπως και το έργο του LF, οι ορισμοί του OSI αναπτύσσονται από και με την κοινότητα. Αυτό συνέβη με τον αρχικό ορισμό του ανοιχτού κώδικα, ο οποίος αναπτύχθηκε με βάση περισσότερα από 20 χρόνια έρευνας. Οι κοινότητες ελεύθερου λογισμικού δημιουργούν και κυκλοφορούν λογισμικό. Αυτό κάναμε με την τεχνητή νοημοσύνη: η κοινότητα έχει πρωτοστατήσει στον ορισμό της τεχνητής νοημοσύνης ανοιχτού κώδικα».
Στη συνέντευξη, ο Meeker πρόσθεσε: «Ελπίζω ότι οι διάφορες προσπάθειες ορισμού (ο ορισμός OSI ανοιχτού κώδικα της τεχνητής νοημοσύνης, ο ορισμός ανοιχτών βαρών που δημοσίευσα για πρώτη φορά το 2022 και αυτός ο νέος ορισμός) μπορούν να συγκλίνουν. οι ορισμοί θα γίνουν το ντε φάκτο πρότυπο, όπως ο ορισμός του ανοιχτού κώδικα — όλοι τους έχουν συγκαλυφθεί από διαφορετικά ρυθμιστικά πλαίσια και κανόνες απορρήτου και από προμηθευτές που θέτουν πρακτικές σε μια εξαιρετικά συγκεντρωμένη αγορά».
Αυτό που καταλήγει αυτή η συζήτηση είναι ότι ακόμα συζητάμε πώς ακριβώς μοιάζει η τεχνητή νοημοσύνη ανοιχτού κώδικα. Είναι αλήθεια ότι οι ηγέτες ανοιχτού κώδικα μπορούν να συμφωνήσουν ότι το να λέμε απλώς ένα πρόγραμμα ή δεδομένα τεχνητής νοημοσύνης είναι ανοιχτά δεν σημαίνει ότι είναι, κάτι που έκανε ο Meta με τον Llama. Ωστόσο, απέχουμε ακόμη πολύ από την εξεύρεση συναίνεσης σχετικά με τον ορισμό της τεχνητής νοημοσύνης ανοιχτού κώδικα.