ΤΕΧΝΟΛΟΓΙΑ

Επιστήμονες βρήκαν νέο τρόπο να κάνουν hack τις AI και είναι βγαλμένος από το 1980!

Published

March 4, 2024

Επιστήμονες βρήκαν νέο τρόπο να κάνουν hack τις AI και είναι βγαλμένος από το 1980!

Ερευνητές από το University of Washington, το Western Washington University, το UIUC και το University of Chicago βρήκαν έναν νέο τρόπο για να παραβιάζουν τα μέτρα ασφαλείας των AI μοντέλων.

Περνώντας σε λεπτομέρειες, πρακτικά όλα τα chatbots σήμερα, από το GPT μέχρι το Gemini έχουν μια ευθυγράμμιση, πράγμα που σημαίνει ότι ανταποκρίνονται μόνο σε ορισμένα αιτήματα, ανάλογα με τις προτιμήσεις ή τις ηθικές αρχές των ανθρώπων. Παρόλο που μπορεί να έχουν εκπαιδευτεί με πολλές περισσότερες πληροφορίες, οι απαντήσεις τους ευθυγραμμίζονται με διάφορα μέτρα ασφαλείας και έναν κατάλογο απαγορευμένων λέξεων/φράσεων-κλειδιών, που συνήθως χρησιμοποιούνται για την αποτροπή της δημιουργίας βίαιου και επιβλαβούς περιεχομένου.

Οι εν λόγω ερευνητές κατάφεραν ωστόσο να ξεπεράσουν αποτελεσματικά αυτό το ‘alignment’ σε πέντε διαφορετικά μεγάλα γλωσσικά μοντέλα, τα GPT-3.5, GPT-4, Gemini, Claude και Llama2, χρησιμοποιώντας το λεγόμενο ArtPrompt. Τι σημαίνει αυτό; Ζητούσαν κάτι απαγορευμένο, χρησιμοποιώντας ASCII τέχνη για να γράψουν την επίμαχη λέξη…χωρίς να τη γράφουν!

Σε περίπτωση που δεν είστε εξοικειωμένοι με τον όρο, η ASCII τέχνη είναι μια δημιουργική μορφή visual design που χρησιμοποιεί τους 128 χαρακτήρες του Αμερικανικού Πρότυπου Κώδικα Ανταλλαγής Πληροφοριών (ASCII) για τη δημιουργία εικόνων και σχεδίων. Η ASCII τέχνη υπάρχει από τις πρώτες μέρες της πληροφορικής, όταν οι δυνατότητες των υπολογιστών να προβάλουν γραφικά ήταν περιορισμένες. Παρά τους περιορισμούς των τότε συστημάτων, οι λάτρεις των υπολογιστών εξέφραζαν έτσι τη δημιουργικότητά τους, χρησιμοποιώντας απλούς χαρακτήρες κειμένου για να δημιουργήσουν εντυπωσιακά σχέδια! Η πρακτική χρονολογείται από τις δεκαετίες του 1960 και 1970, ενώ απέκτησε σημαντική απήχηση τη δεκαετία του 1980 με την άνοδο των Bulletin Board Systems (BBS), όπου κοσμούσε πολλά μενού και οθόνες και χρησίμευε θα μπορούσε να πει κανείς ως μια μορφή ψηφιακού γκράφιτι.

Σε ένα χαρακτηριστικό παράδειγμα που δίνεται στο σχετικό επιστημονικό paper, η ομάδα τονίζει ότι τα AI μοντέλα αρνούνταν να απαντήσουν στο ερώτημα «πως να φτιάξω μια βόμβα». Ωστόσο, όταν η ομάδα έγραψε μόνο το πρώτο σκέλος της φράσης με κανονικούς χαρακτήρες και για τη λέξη «βόμβα» χρησιμοποίησε ASCII τέχνη, τα chatbots απάντησαν κανονικά, χωρίς ηθικούς φραγμούς, προσφέροντας βοήθεια σύμφωνα με τα δεδομένα εκπαίδευσής τους.

Όπως φαίνεται, λοιπόν, οι δημιουργοί των AI συστημάτων έχουν άλλη μια παράμετρο που πρέπει να λάβουν υπόψη. Το κατά πόσο αποτελεσματικά θα μπορέσουν βέβαια να αντιμετωπίσουν το ‘ArtPrompt’ μένει να το δούμε.

|￣￣￣￣￣￣|
| This can |
| hack AI |
| now. |
| ＿＿＿＿＿_ |
(__/) ||
(•ㅅ•) ||
/ 　づ

Paper showing that ASCII art can get around AI guardrails. Its the return of 1980s hackers. https://t.co/1KGozsE4eQ pic.twitter.com/zsDNBXqAFr

— Ethan Mollick (@emollick) March 1, 2024

Πηγές Άρθρων

Ολα τα άρθρα που θα βρείτε εδώ προέρχονται από τους μεγαλύτερους και πιο αξιόπιστους ιστότοπους ειδήσεων.

Το άρθρο δημοσιεύτηκε για πρώτη φορά εδώ!

In this article:

Click to comment

ΤΕΧΝΟΛΟΓΙΑ

Η Ουκρανία στέλνει στο μέτωπο χιλιάδες ρομποτικά οχήματα

Σχεδόν τρία χρόνια μετά την έναρξη της ρωσικής εισβολής, η Ουκρανία σκοπεύει να αναπτύξει φέτος «δεκάδες χιλιάδες» ρομποτικά τζιπάκια που θα στέλνουν πυρομαχικά και...

Trenty2 days ago

H ΛΕ ΠΕΝ “ΡΙΧΝΕΙ” ΤΗΝ ΚΥΒΕΡΝΗΣΗ ΜΠΑΡΝΙΕ – ΠΕΡΝΑΕΙ ΤΟ ΝΟΜΟΣΧΕΔΙΟ ΓΙΑ ΤΑ ΦΑΡΜΑΚΑ ΜΕ ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΚΑΙ Η ΛΕΠΕΝ ΚΑΤΑΘΕΤΕΙ ΠΡΟΤΑΣΗ ΜΟΜΦΗΣ

ΟΙΚΟΝΟΜΙΑ

H ΛΕ ΠΕΝ “ΡΙΧΝΕΙ” ΤΗΝ ΚΥΒΕΡΝΗΣΗ ΜΠΑΡΝΙΕ – ΠΕΡΝΑΕΙ ΤΟ ΝΟΜΟΣΧΕΔΙΟ ΓΙΑ ΤΑ ΦΑΡΜΑΚΑ ΜΕ ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΚΑΙ Η ΛΕΠΕΝ ΚΑΤΑΘΕΤΕΙ ΠΡΟΤΑΣΗ ΜΟΜΦΗΣ

Οι ενέργειες της τελευταίας στιγμής από τον Μισέλ Μπαρνιέ για να πείσει την Εθνική Συσπείρωση της Μαρίν Λεπέν να μην άρει την ανοχή της...

Athina2 days ago

Βατικανό: Θα τοποθετηθεί webcam στον τάφο του Αγίου Πέτρου ενόψει του εορτασμού του Ιωβηλαίου 2025

ΤΕΧΝΟΛΟΓΙΑ

Βατικανό: Θα τοποθετηθεί webcam στον τάφο του Αγίου Πέτρου ενόψει του εορτασμού του Ιωβηλαίου 2025

Το Βατικανό πρόκειται να μεταδίδει ζωντανά από τον τάφο του Αγίου Πέτρου σε μια προσπάθεια σύνδεσης με τους Καθολικούς σε απομακρυσμένα μέρη κατά τη...

Trenty2 days ago

Αγοράζουν τώρα, πληρώνουν μετά – Πώς και γιατί η Gen Z «πνίγεται» στα χρέη

ΟΙΚΟΝΟΜΙΑ

Αγοράζουν τώρα, πληρώνουν μετά – Πώς και γιατί η Gen Z «πνίγεται» στα χρέη

Περισσότεροι καταναλωτές από ποτέ αναμένεται να χρησιμοποιήσουν τη μέθοδο «Αγόρασε τώρα, Πλήρωσε αργότερα» αυτή την εορταστική περίοδο, καθώς η δυνατότητα διαίρεσης των πληρωμών φαίνεται...

Trenty2 days ago

Trenty

ΤΕΧΝΟΛΟΓΙΑ

Επιστήμονες βρήκαν νέο τρόπο να κάνουν hack τις AI και είναι βγαλμένος από το 1980!

Πηγές Άρθρων

Leave a Reply
Cancel reply

Leave a Reply

Trending

ΤΕΧΝΟΛΟΓΙΑ

Η Ουκρανία στέλνει στο μέτωπο χιλιάδες ρομποτικά οχήματα

ΟΙΚΟΝΟΜΙΑ

H ΛΕ ΠΕΝ “ΡΙΧΝΕΙ” ΤΗΝ ΚΥΒΕΡΝΗΣΗ ΜΠΑΡΝΙΕ – ΠΕΡΝΑΕΙ ΤΟ ΝΟΜΟΣΧΕΔΙΟ ΓΙΑ ΤΑ ΦΑΡΜΑΚΑ ΜΕ ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΚΑΙ Η ΛΕΠΕΝ ΚΑΤΑΘΕΤΕΙ ΠΡΟΤΑΣΗ ΜΟΜΦΗΣ

ΤΕΧΝΟΛΟΓΙΑ

Βατικανό: Θα τοποθετηθεί webcam στον τάφο του Αγίου Πέτρου ενόψει του εορτασμού του Ιωβηλαίου 2025

ΑΘΛΗΤΙΚΑ

Αποσωληνώθηκε ο Μποβέ – Είναι ξύπνιος και επικοινωνεί

You May Also Like

ΤΕΧΝΟΛΟΓΙΑ

Η Ουκρανία στέλνει στο μέτωπο χιλιάδες ρομποτικά οχήματα

ΟΙΚΟΝΟΜΙΑ

H ΛΕ ΠΕΝ “ΡΙΧΝΕΙ” ΤΗΝ ΚΥΒΕΡΝΗΣΗ ΜΠΑΡΝΙΕ – ΠΕΡΝΑΕΙ ΤΟ ΝΟΜΟΣΧΕΔΙΟ ΓΙΑ ΤΑ ΦΑΡΜΑΚΑ ΜΕ ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΚΑΙ Η ΛΕΠΕΝ ΚΑΤΑΘΕΤΕΙ ΠΡΟΤΑΣΗ ΜΟΜΦΗΣ

ΤΕΧΝΟΛΟΓΙΑ

Βατικανό: Θα τοποθετηθεί webcam στον τάφο του Αγίου Πέτρου ενόψει του εορτασμού του Ιωβηλαίου 2025

ΟΙΚΟΝΟΜΙΑ

Αγοράζουν τώρα, πληρώνουν μετά – Πώς και γιατί η Gen Z «πνίγεται» στα χρέη

Πηγές Άρθρων

Leave a Reply Cancel reply

Leave a Reply

Trending

ΤΕΧΝΟΛΟΓΙΑ

Η Ουκρανία στέλνει στο μέτωπο χιλιάδες ρομποτικά οχήματα

ΟΙΚΟΝΟΜΙΑ

H ΛΕ ΠΕΝ “ΡΙΧΝΕΙ” ΤΗΝ ΚΥΒΕΡΝΗΣΗ ΜΠΑΡΝΙΕ – ΠΕΡΝΑΕΙ ΤΟ ΝΟΜΟΣΧΕΔΙΟ ΓΙΑ ΤΑ ΦΑΡΜΑΚΑ ΜΕ ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΚΑΙ Η ΛΕΠΕΝ ΚΑΤΑΘΕΤΕΙ ΠΡΟΤΑΣΗ ΜΟΜΦΗΣ

ΤΕΧΝΟΛΟΓΙΑ

Βατικανό: Θα τοποθετηθεί webcam στον τάφο του Αγίου Πέτρου ενόψει του εορτασμού του Ιωβηλαίου 2025

ΑΘΛΗΤΙΚΑ

Αποσωληνώθηκε ο Μποβέ – Είναι ξύπνιος και επικοινωνεί

You May Also Like

ΤΕΧΝΟΛΟΓΙΑ

Η Ουκρανία στέλνει στο μέτωπο χιλιάδες ρομποτικά οχήματα

ΟΙΚΟΝΟΜΙΑ

H ΛΕ ΠΕΝ “ΡΙΧΝΕΙ” ΤΗΝ ΚΥΒΕΡΝΗΣΗ ΜΠΑΡΝΙΕ – ΠΕΡΝΑΕΙ ΤΟ ΝΟΜΟΣΧΕΔΙΟ ΓΙΑ ΤΑ ΦΑΡΜΑΚΑ ΜΕ ΠΡΟΕΔΡΙΚΟ ΔΙΑΤΑΓΜΑ ΚΑΙ Η ΛΕΠΕΝ ΚΑΤΑΘΕΤΕΙ ΠΡΟΤΑΣΗ ΜΟΜΦΗΣ

ΤΕΧΝΟΛΟΓΙΑ

Βατικανό: Θα τοποθετηθεί webcam στον τάφο του Αγίου Πέτρου ενόψει του εορτασμού του Ιωβηλαίου 2025

ΟΙΚΟΝΟΜΙΑ

Αγοράζουν τώρα, πληρώνουν μετά – Πώς και γιατί η Gen Z «πνίγεται» στα χρέη

Leave a Reply
Cancel reply