Η διαφορά μεταξύ ενός συμβατικού μοντέλου και ενός συλλογισμού είναι παρόμοια με τους δύο τύπους σκέψης που περιγράφονται από τον οικονομολόγο που κέρδισε το Νόμπελ Michael Kahneman στο βιβλίο του 2011 Σκέφτομαι γρήγορα και αργή: Γρήγορη και ενστικτώδη σκέψη του συστήματος-1 και πιο αργή πιο συνειδητή σκέψη System-2.

Το είδος του μοντέλου που έκανε το ChatGPT δυνατό, γνωστό ως ένα μεγάλο γλωσσικό μοντέλο ή LLM, παράγει στιγμιαίες απαντήσεις σε μια προτροπή, ερωτώντας ένα μεγάλο νευρωνικό δίκτυο. Αυτές οι εξόδους μπορεί να είναι εντυπωσιακά έξυπνες και συνεκτικές, αλλά ενδέχεται να μην απαντήσουν σε ερωτήσεις που απαιτούν βήμα προς βήμα συλλογισμός, συμπεριλαμβανομένης της απλής αριθμητικής.

Ένα LLM μπορεί να αναγκαστεί να μιμείται τη λογική λογική, εάν έχει την εντολή να βρει ένα σχέδιο που πρέπει να ακολουθήσει. Ωστόσο, αυτό το τέχνασμα δεν είναι πάντα αξιόπιστο και τα μοντέλα συνήθως αγωνίζονται για την επίλυση προβλημάτων που απαιτούν εκτεταμένο, προσεκτικό σχεδιασμό. Το OpenAI, το Google και τώρα ο Anthropic χρησιμοποιούν μια μέθοδο μηχανικής μάθησης γνωστή ως ενίσχυση της μάθησης για να πάρει τα τελευταία μοντέλα τους για να μάθουν να δημιουργούν λογική που δείχνει προς τις σωστές απαντήσεις. Αυτό απαιτεί τη συλλογή πρόσθετων δεδομένων κατάρτισης από τους ανθρώπους για την επίλυση συγκεκριμένων προβλημάτων.

Ο Penn λέει ότι η λειτουργία συλλογιστικής του Claude έλαβε πρόσθετα δεδομένα σχετικά με τις επιχειρηματικές εφαρμογές, συμπεριλαμβανομένου του κώδικα γραφής και καθορισμού, χρησιμοποιώντας υπολογιστές και απαντώντας σε πολύπλοκα νομικά ερωτήματα. “Τα πράγματα που κάναμε βελτιώσεις είναι … τεχνικά θέματα ή θέματα που απαιτούν μεγάλη συλλογιστική”, λέει ο Penn. “Αυτό που έχουμε από τους πελάτες μας είναι πολύ ενδιαφέρον για την ανάπτυξη των μοντέλων μας στον πραγματικό φόρτο εργασίας τους”.

Ο Anthropic λέει ότι το Claude 3.7 είναι ιδιαίτερα καλό στην επίλυση προβλημάτων κωδικοποίησης που απαιτούν λογική βήμα προς βήμα, ξεπερνώντας το O1 του Openai σε ορισμένα σημεία αναφοράς όπως το Swench. Η εταιρεία απελευθερώνει σήμερα ένα νέο εργαλείο, που ονομάζεται CLAUDE Code, ειδικά σχεδιασμένος για αυτό το είδος κωδικοποίησης με βοήθεια AI.

“Το μοντέλο είναι ήδη καλό στην κωδικοποίηση”, λέει ο Penn. Αλλά “η πρόσθετη σκέψη θα ήταν καλή για περιπτώσεις που θα μπορούσαν να απαιτήσουν πολύ περίπλοκο σχεδιασμό – λέτε ότι εξετάζετε μια εξαιρετικά μεγάλη βάση κώδικα για μια εταιρεία”.