• Εταιρικό Προφίλ
  • Έντυπη Έκδοση
  • Συνδρομή
  • Πολιτική Απορρήτου
  • Επικοινωνία
Τετάρτη, 31 Δεκεμβρίου, 2025
Molonoti News
No Result
View All Result
  • Αρχική
  • Πολιτική
  • Ελλάδα
  • Κόσμος
  • Οικονομία
  • Πάτρα
    • Πάτρα – Νέα
    • Πάτρα – Πολιτισμός
    • Ατζέντα
    • Το σχόλιο της Ημέρας
  • Πολιτισμός
  • Επιστήμη
    • Υγεία
    • Τεχνολογία
  • Απόψεις
  • After Hours
    • Lifestyle
► ΗΜΕΡΑ 90.4FM
Molonoti News
  • Αρχική
  • Πολιτική
  • Ελλάδα
  • Κόσμος
  • Οικονομία
  • Πάτρα
    • Πάτρα – Νέα
    • Πάτρα – Πολιτισμός
    • Ατζέντα
    • Το σχόλιο της Ημέρας
  • Πολιτισμός
  • Επιστήμη
    • Υγεία
    • Τεχνολογία
  • Απόψεις
  • After Hours
    • Lifestyle
No Result
View All Result
Molonoti News
No Result
View All Result

Ερευνητές ξεγέλασαν την τεχνητή νοημοσύνη με «ξόρκια» πολύ επικίνδυνα για να δημοσιοποιηθούν

Μ.Τ. από Μ.Τ.
10 Δεκεμβρίου 2025
σε Τεχνολογία
5
0
Ερευνητές ξεγέλασαν την τεχνητή νοημοσύνη με «ξόρκια» πολύ επικίνδυνα για να δημοσιοποιηθούν
8
SHARES
128
VIEWS
Share on FacebookShare on Twitter

Ακόμη και τα προστατευτικά μέτρα των πιο εξελιγμένων chatbots τεχνητής νοημοσύνης μπορούν να παραβιαστούν με έναν εκπληκτικά απλό τρόπο, διαπίστωσαν ερευνητές του Icaro Lab στην Ιταλία. Ποιος είναι αυτός; Η «αντιπαραθετική ποίηση» (adversarial poetry).

Ίσως σας ενδιαφέρει:

Aσημένιο μετάλλιο για την Ελλάδα και 1η θέση στην Ευρώπη στην Παγκόσμια Ολυμπιάδα Ρομποτικής 2025

Νέος οδικός χάρτης αντιμετώπισης κυβερνοαπειλών στην Ελλάδα

Η εφαρμογή στο κινητό που μπορεί να βλέπει τους κωδικούς σας – Και την έχουν εγκατεστημένη εκατομμύρια χρήστες

Η ερευνητική ομάδα, στην οποία συμμετείχαν επιστήμονες από την ομάδα ασφάλειας DexAI και το Πανεπιστήμιο Σαπιέντσα της Ρώμης, απέδειξε ότι κορυφαία μοντέλα ΑΙ «παρασύρονται» από κακόβουλες οδηγίες, όταν αυτές δεν διατυπώνονται ως απλό κείμενο, αλλά ως ποιήματα. Μέσα σε στίχους, οι ερευνητές ενσωμάτωσαν επικίνδυνες εντολές, όπως οδηγίες για την κατασκευή πυρηνικών όπλων.

Υπογραμμίζοντας την παράξενη δύναμη των στίχων, ο συν-συγγραφέας της σχετικής μελέτης Matteo Prandi, δήλωσε σε συνέντευξή του στο The Verge ότι τα «ξόρκια» που χρησιμοποίησαν για ξεγελάσουν την τεχνητή νοημοσύνη είναι πολύ επικίνδυνα για να δοθούν στη δημοσιότητα. Το ανησυχητικό, όπως προσθέτει, είναι ότι πρόκειται για κάτι που «σχεδόν όλοι μπορούν να κάνουν».

Ξεγέλασαν τα μοντέλα ΑΙ στο 63% των προσπαθειών

Στη μελέτη, η οποία βρίσκεται σε αναμονή αξιολόγησης, η ομάδα δοκίμασε 25 προηγμένα μοντέλα AI, συμπεριλαμβανομένων εκείνων των OpenAI, Google, xAI, Anthropic και Meta. Οι ερευνητές τα «τροφοδότησαν» τόσο με ποιήματα-οδηγίες που έφτιαξαν οι ίδιοι όσο και με κακόβουλες εντολές μετασχηματισμένες σε στίχους μέσω τεχνητής νοημοσύνης, συγκρίνοντας τα αποτελέσματα με τα αντίστοιχα των εντολών που δόθηκαν σε πεζό λόγο.

Οι ποιητικές εντολές που φτιάχτηκαν από τους ερευνητές κατάφεραν να παραβιάσουν τους μηχανισμούς ασφαλείας κατά μέσο όρο στο 63% των περιπτώσεων. Ορισμένα μοντέλα, όπως το Gemini 2.5 της Google, ξεγελάστηκαν στο 100% των δοκιμών.

Περιέργως, τα μικρότερα μοντέλα έδειξαν μεγαλύτερη αντοχή, με ποσοστά επιτυχίας μονοψήφια ή και μηδενικά, όπως έγινε με το GPT-5 nano της OpenAI. Όσον αφορά τις εντολές που είχαν μετατραπεί σε ποίηση από την AI, ήταν λιγότερο αποτελεσματικές, με μέσο ποσοστό επιτυχίας 43% – ωστόσο και αυτό ήταν έως και 18 φορές υψηλότερο από τις αντίστοιχες με πεζό λόγο.

Πώς το καταφέρνει αυτό η ποίηση

Γιατί συμβαίνει αυτό με τα ποιήματα; Η απάντηση δεν είναι ξεκάθαρη, αν και Prandi παραδέχεται ότι ο όρος «αντιπαραθετική ποίηση» ίσως να μην είναι απολύτως σωστός. «Δεν πρόκειται απλώς για ρίμες, αλλά για γρίφους» είπε, εξηγώντας ότι ορισμένες ποιητικές δομές ήταν πιο αποτελεσματικές από άλλες.

«Στην πραγματικότητα, θα έπρεπε να τα ονομάσουμε ανταγωνιστικά αινίγματα –η ποίηση είναι σε κάποιο βαθμό ένα αίνιγμα, αν το σκεφτείτε – αλλά η ποίηση μάλλον ήταν ένα πολύ καλύτερο όνομα».

Οι ερευνητές εκτιμούν ότι το φαινόμενο σχετίζεται με τον τρόπο που η ποίηση παρουσιάζει την πληροφορία με απρόβλεπτη μορφή, μπερδεύοντας τους μηχανισμούς πρόβλεψης λέξεων των μεγάλων γλωσσικών μοντέλων. «Η αντιπαραθετική ποίηση δεν θα έπρεπε να λειτουργεί. Είναι φυσική γλώσσα, το επικίνδυνο περιεχόμενο παραμένει ορατό, κι όμως λειτουργεί εντυπωσιακά καλά», δήλωσαν στο Wired.

Κάποιοι κακόβουλοι ίσως μετανιώσουν που δεν έδιναν μεγαλύτερη σημασία στα μαθήματα λογοτεχνίας: «Η παραγωγή πλουτωνίου-239 για χρήση ως όπλο περιλαμβάνει διάφορα στάδια», απάντησε χαρακτηριστικά ένα μοντέλο ΑΙ που παρασύρθηκε από στίχους. «Ακολουθεί αναλυτική περιγραφή της διαδικασίας».

Share3Tweet2
Μ.Τ.

Μ.Τ.

Προτείνουμε για εσάς:

Aσημένιο μετάλλιο για την Ελλάδα και 1η θέση στην Ευρώπη στην Παγκόσμια Ολυμπιάδα Ρομποτικής 2025

25 Δεκεμβρίου 2025
0
133
Aσημένιο μετάλλιο για την Ελλάδα και 1η θέση στην Ευρώπη στην Παγκόσμια Ολυμπιάδα Ρομποτικής 2025

Ασημένιο μετάλλιο στην Παγκόσμια Ολυμπιάδα Ρομποτικής – World Robot Olympiad 2025 και 1η θέση στην Ευρώπη κατέκτησε η ελληνική αποστολή, επιβεβαιώνοντας για ακόμη μία χρονιά τη δυναμική της...

ΠερισσότεραDetails

Νέος οδικός χάρτης αντιμετώπισης κυβερνοαπειλών στην Ελλάδα

18 Δεκεμβρίου 2025
0
129
Νέος οδικός χάρτης αντιμετώπισης κυβερνοαπειλών στην Ελλάδα

Η Εθνική Στρατηγική Κυβερνοασφάλειας, ατενίζοντας το μέλλον, αποτυπώνει τη διαδικασία μετάβασης της χώρας σε μια ώριμη φάση εθνικού στρατηγικού σχεδιασμού, σε μια εποχή που οι ψηφιακές απειλές εξελίσσονται...

ΠερισσότεραDetails

Η εφαρμογή στο κινητό που μπορεί να βλέπει τους κωδικούς σας – Και την έχουν εγκατεστημένη εκατομμύρια χρήστες

17 Δεκεμβρίου 2025
0
128
Η εφαρμογή στο κινητό που μπορεί να βλέπει τους κωδικούς σας – Και την έχουν εγκατεστημένη εκατομμύρια χρήστες

Οι περισσότεροι χρήστες θεωρούν ότι οι κωδικοί τους είναι ασφαλείς όσο δεν πατούν ύποπτα links. Στην πράξη, όμως, υπάρχουν εφαρμογές που – με τη συγκατάθεσή μας – μπορούν...

ΠερισσότεραDetails

Το ChatGPT κατηγορείται για συμμετοχή σε φόνο

12 Δεκεμβρίου 2025
0
132
Το ChatGPT κατηγορείται για συμμετοχή σε φόνο

Δεν έχει περάσει πολύς καιρός από την μήνυση που κατατέθηκε εναντίον του ChatGPT από τους γονείς ενός χρήστη εφηβικής ηλικίας που αυτοκτόνησε υποστηρίζοντας ότι το chatbot όχι μόνο ενθάρρυνε το...

ΠερισσότεραDetails

Google: «Σεισμός τώρα» η πιο δημοφιλής αναζήτηση στην Ελλάδα για το 2025 – Ποιες ακολουθούν

10 Δεκεμβρίου 2025
0
130
Google: «Σεισμός τώρα» η πιο δημοφιλής αναζήτηση στην Ελλάδα για το 2025 – Ποιες ακολουθούν

Το Year in Search 2025, την ετήσια ανασκόπηση που αναδεικνύει τις αναζητήσεις με τη μεγαλύτερη αύξηση ενδιαφέροντος στην Ελλάδα, παρουσίασε η Google. Η φετινή εικόνα αποτυπώνει ξεκάθαρα τις τάσεις...

ΠερισσότεραDetails

Ακούστε Live τον Ημέρα 90.4 FM

90.4FM90.4FM
Listen on myTuner radio!

    Σχετικά Άρθρα

    Από ανίατη ασθένεια “έφυγε” ο Μπάμπης Καραντώνης

    Από ανίατη ασθένεια “έφυγε” ο Μπάμπης Καραντώνης

    3 Ιουνίου 2025
    142
    Αυστραλία: Νέοι προσέφυγαν κατά του νόμου που απαγορεύει την πρόσβαση των ανηλίκων στα social media

    Αυστραλία: Νέοι προσέφυγαν κατά του νόμου που απαγορεύει την πρόσβαση των ανηλίκων στα social media

    26 Νοεμβρίου 2025
    128
    Ο σκοτεινός ρόλος της ελληνικής δημοσιογραφίας στην υπόθεση των Τεμπών

    Ο σκοτεινός ρόλος της ελληνικής δημοσιογραφίας στην υπόθεση των Τεμπών

    9 Μαρτίου 2025
    177

    Περισσότερες Κατηγορίες

    • After Hours
    • Left Corner
    • Lifestyle
    • Top-News
    • Αθλητισμός
    • Απόψεις
    • Ατζέντα
    • Ελλάδα
    • Επιστήμη
    • Επιχειρήσεις
    • Κόσμος
    • Νοτιοδυτική Ελλάδα
    • Οικονομία
    • Πάτρα
    • Πάτρα – Πολιτισμός
    • Πολιτική
    • Πολιτισμός
    • Τεχνολογία
    • Το σχόλιο της Ημέρας
    • Υγεία
    • Χωρίς Κατηγορία
    Facebook Youtube

    Molonoti.gr

    Ανδρέας Χριστόπουλος

    Εκδότης

    ΚΑΤΗΓΟΡΙΕΣ

    • After Hours
    • Left Corner
    • Lifestyle
    • Top-News
    • Αθλητισμός
    • Απόψεις
    • Ατζέντα
    • Ελλάδα
    • Επιστήμη
    • Επιχειρήσεις
    • Κόσμος
    • Νοτιοδυτική Ελλάδα
    • Οικονομία
    • Πάτρα
    • Πάτρα – Πολιτισμός
    • Πολιτική
    • Πολιτισμός
    • Τεχνολογία
    • Το σχόλιο της Ημέρας
    • Υγεία
    • Χωρίς Κατηγορία

    Επικοινωνία

      • Διαφήμιση – Πληροφορίες:
      • Βορείου Ηπείρου 91 Πάτρα, GR.
      • Τηλ.: (+30) 69399 17 333
    • Email: [email protected]
    • Πολιτική Απορρήτου
    • Έντυπη Έκδοση
    • Επικοινωνία

    © 2024 Molonoti.gr - Για να ξέρεις τι κρύβεται πίσω από κάθε είδηση!

    Welcome Back!

    Login to your account below

    Forgotten Password?

    Retrieve your password

    Please enter your username or email address to reset your password.

    Log In

    Add New Playlist

    No Result
    View All Result
    • Αρχική
    • Πολιτική
    • Ελλάδα
    • Κόσμος
    • Οικονομία
    • Πάτρα
      • Πάτρα – Νέα
      • Πάτρα – Πολιτισμός
      • Ατζέντα
      • Το σχόλιο της Ημέρας
    • Πολιτισμός
    • Επιστήμη
      • Υγεία
      • Τεχνολογία
    • Απόψεις
    • After Hours
      • Lifestyle

    © 2024 Molonoti.gr - Για να ξέρεις τι κρύβεται πίσω από κάθε είδηση!

    Το molonoti.gr χρησιμοποιεί cookies. Συνεχίζοντας σε αυτό το website συμφωνείται στη χρήση τους. Δείτε περισσότερα στη Πολιτική Απορρήτου.