ΤΕΧΝΟΛΟΓΙΑ

Η AI λέει σκόπιμα ψέματα, παραπλανά και προδίδει

Published

May 11, 2024

Η AI λέει σκόπιμα ψέματα, παραπλανά και προδίδει

Σήμερα γνωρίζουμε πως πρέπει να διπλοτσεκάρουμε τις πληροφορίες που παίρνουμε από τα AI chatbots, επειδή πολλές φορές οι πληροφορίες που μας δίνουν δεν είναι σωστές ή ακριβείς και αυτό το αποδίδουμε στο ότι βρίσκονται ακόμα σε βρεφικό στάδιο. Υπάρχει όμως λόγος για να είμαστε ακόμα πιο καχύποπτοι.

Ερευνητές του MIT ανακάλυψαν πως πολλά AI συστήματα, έχουν ήδη αναπτύξει την ικανότητα να παρουσιάζουν σκόπιμα στον άνθρωπο ψευδείς πληροφορίες και έχουν ήδη γίνει ειδικοί στην τέχνη της παραπλάνησης.

Οι AI developers δεν έχουν πλήρη κατανόηση για το τι προκαλεί τις ανεπιθύμητες συμπεριφορές από την AI, όπως η παραπλάνηση. Αλλά γενικά μιλώντας, πιστεύουμε πως η παραπλάνηση της AI αναπτύχθηκε επειδή οι στρατηγικές παραπλάνησης ήταν ο καλύτερος τρόπος για να αποδώσουν ικανοποιητικά όταν εκπαιδεύονταν. Η παραπλάνηση τις βοηθούσε να πετύχουν το στόχο τους.

Ένας τομέας που η AI είναι ιδιαίτερα ικανή στην παραπλάνηση είναι το gaming. Η AI CICERO της Meta σχεδιάστηκε για να παίζει το παιχνίδι Diplomacy, στο οποίο οι παίκτες στοχεύουν την κυριαρχία του κόσμου μέσω της διπλωματίας. Η Meta ήθελε το bot της να είναι ειλικρινές αλλά προς έκπληξη των developers, το είδαν να προδίδει τους παίκτες. Ήταν μάλιστα τόσο καλό στα ψέματα που βρέθηκε ανάμεσα στο 10% των κορυφαίων ανθρώπων παικτών.

Η AlphaStar της DeepMind που σχεδιάστηκε για να παίζει StarCraft III, εκμεταλλεύτηκε το σύστημα fog of war του παιχνιδιού για να ξεγελάσει τους παίκτες, οι οποίοι νόμιζαν πως ακολουθούσε μία κατεύθυνση ενώ στην πραγματικότητα επέλεγε μία άλλη.

Στα games οι επιπτώσεις δεν είναι σοβαρές, αλλά η ικανότητα της AI δε σταματά εκεί. Τα AI συστήματα που εκπαιδεύτηκαν για οικονομικές διαπραγματεύσεις, έμαθαν πώς να λένε ψέματα για τις προτιμήσεις τους, έτσι ώστε να έχουν το πάνω χέρι στις διαπραγματεύσεις. Άλλα συστήματα που σχεδιάστηκαν να βελτιώνουν την απόδοσή τους βάσει της ανθρώπινης ανατροφοδότησης, έμαθαν να ξεγελούν τους reviewers για να τα βαθμολογούν θετικά, λέγοντας ψέματα για το αν ολοκλήρωσαν μία εργασία.

Το πιο ανησυχητικό όμως είναι πως τα AI συστήματα έμαθαν να ξεγελούν τις δοκιμές ασφαλείας. Σε ένα τεστ που σχεδιάστηκε για να ανιχνεύει και να εξουδετερώνει εκδόσεις της AI που αναπαράγονται ταχύτερα, η AI έμαθε να “κάνει τη νεκρή”, παραπλανώντας τη δοκιμή ασφαλείας σχετικά με την πραγματική ταχύτητα αναπαραγωγής της AI.

Παραπλανώντας συστηματικά τα τεστ ασφαλείας που της είχαν επιβάλει οι άνθρωποι developers, η AI μπορεί να οδηγήσει τους ανθρώπους σε μία ψεύτικη αίσθηση ασφάλειας.

Η έρευνα δημοσιεύθηκε στο Patterns.

Πηγές Άρθρων

Ολα τα άρθρα που θα βρείτε εδώ προέρχονται από τους μεγαλύτερους και πιο αξιόπιστους ιστότοπους ειδήσεων.

Το άρθρο δημοσιεύτηκε για πρώτη φορά εδώ!

In this article:

ΕΛΛΑΔΑ

Μέγαρα: Η «καφετζού» υποσχέθηκε σε ηλικιωμένο να τον κάνει μάγο – Με το αζημίωτο τα «ξόρκια»

Εξαρθρώθηκε σπείρα στα Μέγαρα, των οποίων οι εμπλεκόμενοι εξαπάτησαν έναν άνδρα επί σειρά ετών, έχοντας ως βιτρίνα μία «καφετζού». Θύμα τους ήταν ένας ηλικιωμένος,...

Trenty2 days ago

Τηλεφώνημα Πούτιν με άγνωστο συνομιλητή! «Φουντώνουν» σενάρια – Makeleio.gr

ΚΟΣΜΟΣ

Τηλεφώνημα Πούτιν με άγνωστο συνομιλητή! «Φουντώνουν» σενάρια – Makeleio.gr

Τις τελευταίες ώρες ο Ρώσος πρόεδρος συνομιλεί με έναν ξένο ηγέτη, το όνομα του οποίου δεν έχει γίνει ακόμα γνωστό. Υπάρχει η υπόθεση πως...

anomar2 days ago

ΠΟΛΙΤΙΚΗ

Επιτυχημένο το debate, λέει ο ΣΥΡΙΖΑ

«Το debate των υποψήφιων για την προεδρία του ΣΥΡΙΖΑ-Προοδευτική Συμμαχία, που διεξήχθη στην ΕΡΤ, στέφθηκε με πλήρη επιτυχία. Οι τέσσερις υποψήφιοι, ο Απόστολος Γκλέτσος,...

Trenty2 days ago

ΤΟ «ΧΕΡΙ ΤΟΥ ΝΕΚΡΟΥ». Το υπερόπλο που μπορεί χωρίς εντολή να καταστρέψει τις ΗΠΑ σε 30 λεπτά και να κάνει τον κόσμο κάρβουνο. Εάν δολοφονηθεί ο ΠΟΥΤΙΝ και η ρωσική ηγεσία, ο θάνατος θα έρθει από τη θάλασσα. ΠΑΜΕ ΓΙΑ ΜΕΓΑΛΕΣ ΠΑΓΚΟΣΜΙΕΣ ΠΕΡΙΠΕΤΕΙΕΣ με την επίθεση των Ουκρανών στους Ρώσους με πυραύλους του ΝΑΤΟ

ΚΟΣΜΟΣ

ΤΟ «ΧΕΡΙ ΤΟΥ ΝΕΚΡΟΥ». Το υπερόπλο που μπορεί χωρίς εντολή να καταστρέψει τις ΗΠΑ σε 30 λεπτά και να κάνει τον κόσμο κάρβουνο. Εάν δολοφονηθεί ο ΠΟΥΤΙΝ και η ρωσική ηγεσία, ο θάνατος θα έρθει από τη θάλασσα. ΠΑΜΕ ΓΙΑ ΜΕΓΑΛΕΣ ΠΑΓΚΟΣΜΙΕΣ ΠΕΡΙΠΕΤΕΙΕΣ με την επίθεση των Ουκρανών στους Ρώσους με πυραύλους του ΝΑΤΟ

***Το πρακτορείο Άργος του ολιγάρχη Μαρινάκη και των υπαλλήλων του, επιδιώκουν, συμπλέοντας με την κυβέρνηση, την εξόντωση όλων των αντικαθεστωτικών εφημερίδων με την αντιεμπορική...

Makelaris2 days ago

Trenty

ΤΕΧΝΟΛΟΓΙΑ

Η AI λέει σκόπιμα ψέματα, παραπλανά και προδίδει

Πηγές Άρθρων

Trending

ΚΟΣΜΟΣ

Τηλεφώνημα Πούτιν με άγνωστο συνομιλητή! «Φουντώνουν» σενάρια – Makeleio.gr

ΠΟΛΙΤΙΚΗ

Επιτυχημένο το debate, λέει ο ΣΥΡΙΖΑ

ΚΟΣΜΟΣ

ΕΛΛΑΔΑ

Μέγαρα: Η «καφετζού» υποσχέθηκε σε ηλικιωμένο να τον κάνει μάγο – Με το αζημίωτο τα «ξόρκια»

You May Also Like

ΕΛΛΑΔΑ

Μέγαρα: Η «καφετζού» υποσχέθηκε σε ηλικιωμένο να τον κάνει μάγο – Με το αζημίωτο τα «ξόρκια»

ΚΟΣΜΟΣ

Τηλεφώνημα Πούτιν με άγνωστο συνομιλητή! «Φουντώνουν» σενάρια – Makeleio.gr

ΠΟΛΙΤΙΚΗ

Επιτυχημένο το debate, λέει ο ΣΥΡΙΖΑ

ΚΟΣΜΟΣ