Ενισχύοντας τις νέες δυνατότητες του Meta AI είναι μια αναβαθμισμένη έκδοση του Llama, του κορυφαίου μοντέλου μεγάλων γλωσσών της Meta. Το δωρεάν μοντέλο που ανακοινώθηκε σήμερα μπορεί επίσης να έχει ευρύ αντίκτυπο, δεδομένου του πόσο ευρέως έχει υιοθετηθεί ήδη η οικογένεια Llama από προγραμματιστές και startups.

Σε αντίθεση με τα μοντέλα του OpenAI, το Llama μπορεί να ληφθεί και να εκτελεστεί τοπικά χωρίς χρέωση—αν και υπάρχουν ορισμένοι περιορισμοί σε μεγάλης κλίμακας εμπορική χρήση. Το Llama μπορεί επίσης να ρυθμιστεί πιο εύκολα ή να τροποποιηθεί με πρόσθετη εκπαίδευση, για συγκεκριμένες εργασίες.

Ο Patrick Wendell, συνιδρυτής και αντιπρόεδρος μηχανικής στην Databricks, μια εταιρεία που φιλοξενεί μοντέλα τεχνητής νοημοσύνης, συμπεριλαμβανομένου του Llama, λέει ότι πολλές εταιρείες έλκονται από ανοιχτά μοντέλα επειδή τους επιτρέπουν να προστατεύουν καλύτερα τα δεδομένα τους.

Τα μοντέλα μεγάλων γλωσσών γίνονται όλο και περισσότερο «πολυτροπικά», που σημαίνει ότι εκπαιδεύονται να χειρίζονται ήχο και εικόνες ως είσοδο καθώς και κείμενο. Αυτό επεκτείνει τις ικανότητες ενός μοντέλου και επιτρέπει στους προγραμματιστές να δημιουργήσουν νέα είδη εφαρμογών τεχνητής νοημοσύνης πάνω από αυτό, συμπεριλαμβανομένων των λεγόμενων πρακτόρων τεχνητής νοημοσύνης που είναι ικανοί να εκτελούν χρήσιμες εργασίες σε υπολογιστές για λογαριασμό τους. Το Llama 3.2 θα πρέπει να διευκολύνει τους προγραμματιστές να δημιουργήσουν πράκτορες τεχνητής νοημοσύνης που μπορούν, ας πούμε, να περιηγηθούν στον ιστό, ίσως αναζητώντας προσφορές για έναν συγκεκριμένο τύπο προϊόντος όταν δίνεται μια σύντομη περιγραφή.

«Τα πολυτροπικά μοντέλα είναι μεγάλη υπόθεση, επειδή τα δεδομένα που χρησιμοποιούν οι άνθρωποι και οι επιχειρήσεις δεν είναι απλώς κείμενο, μπορούν να έρθουν σε πολλές διαφορετικές μορφές, συμπεριλαμβανομένων εικόνων και ήχου ή πιο εξειδικευμένων μορφών όπως ακολουθίες πρωτεϊνών ή λογιστικά βιβλία», λέει ο Phillip Isola, καθηγητής στο MIT “Τα τελευταία χρόνια έχουμε μετατραπεί από μοντέλα ισχυρής γλώσσας σε μοντέλα που λειτουργούν καλά σε εικόνες και φωνές κάθε χρόνο, βλέπουμε ότι γίνονται προσιτές περισσότερες λεπτομέρειες σε αυτά τα συστήματα.”

«Με το Llama 3.1, η Meta έδειξε ότι τα ανοιχτά μοντέλα θα μπορούσαν επιτέλους να κλείσουν το χάσμα με τα ιδιόκτητα αντίστοιχά τους», λέει ο Nathan Benaich, ιδρυτής και γενικός συνεργάτης της Air Street Capital και συγγραφέας μιας ετήσιας έκθεσης με επιρροή για την τεχνητή νοημοσύνη. Ο Benaich προσθέτει ότι τα πολυτροπικά μοντέλα τείνουν να ξεπερνούν την απόδοση των μεγαλύτερων μόνο κειμένου. «Είμαι ενθουσιασμένος που βλέπω πώς διαμορφώνεται το 3.2», λέει.

Νωρίτερα σήμερα, το Allen Institute for AI (Ai2), ένα ερευνητικό ινστιτούτο στο Σιάτλ, κυκλοφόρησε ένα προηγμένο πολυτροπικό μοντέλο ανοιχτού κώδικα που ονομάζεται Molmo. Το Molmo κυκλοφόρησε με λιγότερο περιοριστική άδεια από το Llama και το Ai2 δημοσιεύει επίσης λεπτομέρειες των δεδομένων εκπαίδευσης του, που μπορούν να βοηθήσουν τους ερευνητές και τους προγραμματιστές να πειραματιστούν και να τροποποιήσουν το μοντέλο.

Η Meta είπε σήμερα ότι θα κυκλοφορήσει πολλά μεγέθη Llama 3.2 με αντίστοιχες δυνατότητες. Εκτός από δύο πιο ισχυρές παρουσίες με 11 δισεκατομμύρια και 90 δισεκατομμύρια παραμέτρους – ένα μέτρο της πολυπλοκότητας ενός μοντέλου καθώς και του μεγέθους του – η Meta κυκλοφορεί λιγότερο ικανές εκδόσεις 1 δισεκατομμυρίου και 3 δισεκατομμυρίων παραμέτρων που έχουν σχεδιαστεί για να λειτουργούν καλά σε φορητές συσκευές. Η Meta λέει ότι αυτές οι εκδόσεις έχουν βελτιστοποιηθεί για τσιπ κινητών που βασίζονται σε ARM από την Qualcomm και την MediaTek.

Η αναθεώρηση της τεχνητής νοημοσύνης της Meta έρχεται σε μια δύσκολη στιγμή, με τους τεχνολογικούς γίγαντες να αγωνίζονται για να προσφέρουν την πιο προηγμένη τεχνητή νοημοσύνη. Η απόφαση της εταιρείας να κυκλοφορήσει δωρεάν τα πολυτιμότερα μοντέλα της μπορεί να της δώσει ένα πλεονέκτημα στην παροχή της βάσης για πολλά εργαλεία και υπηρεσίες τεχνητής νοημοσύνης – ειδικά καθώς οι εταιρείες αρχίζουν να εξερευνούν τις δυνατότητες των πρακτόρων AI.