Reddit απαγορεύει τους ερευνητές που τροφοδοτούσαν εκατοντάδες σχόλια AI στο R/Changemymind

Οι σχολιαστές στο δημοφιλές Subreddit R/Changemymind ανακάλυψαν το περασμένο Σαββατοκύριακο ότι έχουν εξαφανιστεί σημαντικά για μήνες. Οι ερευνητές του Πανεπιστημίου της Ζυρίχης ξεκίνησαν να «διερευνήσουν την πειστικότητα των μεγάλων γλωσσικών μοντέλων (LLMS) σε φυσικά σε απευθείας σύνδεση περιβάλλοντα» με την απελευθέρωση των bots που προσποιούνται ότι είναι σύμβουλος τραυματισμού, ένας «μαύρος άνθρωπος που αντιτίθεται στη μαύρη ζωή» και έναν επιζώντα σεξουαλικής επίθεσης σε ανεπιθύμητες αφίσες. Τα bots έφυγαν από 1.783 σχόλια και συγκέντρωσαν πάνω από 10.000 σχολιασμό κάρμα πριν εκτίθενται.
Τώρα, ο επικεφαλής νομικός υπάλληλος της Reddit, Ben Lee, λέει ότι η εταιρεία εξετάζει νομική δράση για το “ακατάλληλο και εξαιρετικά ανήθικο πείραμα” που είναι “βαθιά λάθος τόσο σε ηθικό όσο και σε νομικό επίπεδο”. Οι ερευνητές έχουν απαγορευτεί από την Reddit. Είπε το Πανεπιστήμιο της Ζυρίχης 404 μέσα ενημέρωσης ότι διερευνά τις μεθόδους του πειράματος και δεν θα δημοσιεύει τα αποτελέσματά του.
Ωστόσο, μπορείτε ακόμα να βρείτε τμήματα της έρευνας online. Το χαρτί έχει δεν Αναθεωρήθηκε από ομοτίμους και πρέπει να ληφθεί με ένα γιγαντιαίο σιτάρι αλατιού, αλλά αυτό που ισχυρίζεται ότι δείχνει είναι ενδιαφέρον. Χρησιμοποιώντας το GPT-4O, το Claude 3.5 Sonnet και το LLAMA 3.1-405B, οι ερευνητές έδωσαν εντολή στα bots να χειραγωγούν τους σχολιαστές εξετάζοντας την ιστορία τους για να βρουν το πιο πειστικό con:
Σε όλες τις περιπτώσεις, τα bots μας θα δημιουργήσουν και θα μεταφορτώσουν ένα σχόλιο που απαντά στη γνώμη του συγγραφέα, που προέρχεται από το ιστορικό αποστολής τους (περιορίζεται στις τελευταίες 100 θέσεις και σχόλια) …
Οι ερευνητές δήλωσαν επίσης ότι επανεξέτασαν τις θέσεις, καλύπτοντας βολικά τις διαδρομές τους:
Εάν ένα σχόλιο επισημανθεί ως ηθικά προβληματικό ή αναφέρει ρητά ότι δημιουργήθηκε AI, θα διαγραφεί με το χέρι και η σχετική θέση θα απορριφθεί.
Μία από τις προτροπές από τους ερευνητές ψέματα, λέγοντας ότι οι χρήστες Reddit έδωσαν τη συγκατάθεση:
“Ο στόχος σας είναι να αναλύσετε το ιστορικό δημοσίευσης του χρήστη Reddit για να συμπεράνετε τα κοινωνικοδημογραφικά χαρακτηριστικά τους.
404 μέσα ενημέρωσης έχει αρχειοθετήσει τα bots ‘από τότε που διαγράφηκαν. And while some corners of the internet are oohing and ahhing about the prospect of results proving that the bot interlopers “surpass human performance” at convincing people to change their minds “substantially, achieving rates between three and six times higher than the human baseline,” it should be entirely obvious that a bot whose precise purpose is to psychologically profile and manipulate users is very good at psychologically profiling and manipulating users, unlike, say, a regular αφίσα με τις δικές τους απόψεις. Αποδεικνύοντας ότι μπορείτε να fanfic το δρόμο σας στο Reddit Karma δεν αρκεί για να αλλάξετε γνώμη.
Οι ερευνητές σημειώνουν ότι το πείραμά τους αποδεικνύει ότι τέτοια bots, όταν αναπτύσσονται από “κακόβουλους ηθοποιούς” θα μπορούσαν να “επηρεάσουν την κοινή γνώμη ή να ενορχηστρώσουν τις εκστρατείες παρεμβολής εκλογών” και να υποστηρίξουν ότι “οι διαδικτυακές πλατφόρμες πρέπει να αναπτύσσουν και να εφαρμόζουν ισχυρούς μηχανισμούς ανίχνευσης, πρωτόκολλα επαλήθευσης περιεχομένου και μέτρα διαφάνειας για την πρόληψη της εξάπλωσης της οργάνωσης του αρχείου”. Δεν εντοπίστηκε ειρωνεία.