Καθώς τα εργαλεία τεχνητής νοημοσύνης που παράγουν κείμενο εξαπλώνονται, εκπαιδευτικά ιδρύματα, επιχειρήσεις και καταναλωτές θέλουν να γνωρίζουν αν κάτι που διαβάζουν έχει γραφτεί από άνθρωπο ή μηχανή.
Η θέσπιση κανόνων για τη χρήση περιεχομένου που παράγεται από ΑΙ είναι σχετικά απλή. Η εφαρμογή τους, όμως, προϋποθέτει κάτι πολύ πιο δύσκολο: την αξιόπιστη ανίχνευση του αν ένα κείμενο έχει γραφτεί από τεχνητή νοημοσύνη, αναφέρει το The Conversation.
Έρευνες δείχνουν ότι ορισμένοι άνθρωποι – ιδίως όσοι χρησιμοποιούν συστηματικά εργαλεία ΑΙ –μπορούν να αναγνωρίσουν με ακρίβεια τέτοια κείμενα. Σε ελεγχόμενες συνθήκες, ομάδες ανθρώπινων αξιολογητών μπορεί να υπερέχουν ακόμη και έναντι αυτοματοποιημένων εργαλείων. Ωστόσο, αυτή η εξειδίκευση δεν είναι διαδεδομένη και η ατομική κρίση συχνά αποδεικνύεται ασυνεπής. Γι’ αυτό οργανισμοί που χρειάζονται μαζική και ομοιόμορφη αξιολόγηση στρέφονται σε αυτοματοποιημένους ανιχνευτές.
Το πρόβλημα της ανίχνευσης κειμένων ΑΙ
Η βασική λογική της ανίχνευσης είναι απλή: ένα κείμενο περνά από ένα εργαλείο (συχνά και αυτό βασισμένο σε ΑΙ) το οποίο παράγει μια βαθμολογία με τη μορφή πιθανότητας για το κατά πόσο το κείμενο έχει παραχθεί από μηχανή. Το αποτέλεσμα αυτό χρησιμοποιείται για περαιτέρω αποφάσεις, όπως η επιβολή κυρώσεων.
Στην πράξη, όμως, η διαδικασία αυτή στηρίζεται σε κρίσιμες παραδοχές. Είναι γνωστό ποια εργαλεία ΑΙ ενδέχεται να χρησιμοποιήθηκαν; Υπάρχει πρόσβαση σε αυτά; Πόσο μεγάλο είναι το δείγμα κειμένου; Πρόκειται για ένα μεμονωμένο κείμενο ή για συλλογή γραπτών σε βάθος χρόνου; Οι απαντήσεις καθορίζουν σε μεγάλο βαθμό τι μπορεί και τι δεν μπορεί να συμπεράνει ένα εργαλείο ανίχνευσης.
Ιδιαίτερη σημασία έχει και το αν το σύστημα ΑΙ που δημιούργησε το υπό έρευνα κείμενο έχει ενσωματώσει εκ προθέσεως δείκτες για να διευκολύνει την μετέπειτα ανίχνευση. Τα αποκαλούμενα υδατογραφήματα μέσα σε ένα κείμενο είναι «σημάδια» μη ανιχνεύσιμα με γυμνό μάτι, που επιτρέπουν σε όποιον διαθέτει το κατάλληλο «κλειδί» να επαληθεύσει την προέλευση του κειμένου. Η μέθοδος αυτή, ωστόσο, προϋποθέτει τη συνεργασία των παρόχων ΑΙ και δεν είναι πάντα διαθέσιμη.
Πώς λειτουργούν τα εργαλεία ανίχνευσης ΑΙ
Η πιο διαδεδομένη προσέγγιση βασίζεται στη χρήση της ίδιας της τεχνητής νοημοσύνης. Συλλέγονται μεγάλα σύνολα κειμένων που έχουν επισημανθεί ως δημιουργημένα από ανθρώπους ή από ΑΙ, και στη συνέχεια ένα μοντέλο εκπαιδεύεται ώστε να διακρίνει ποιο είναι τι.
Η διαδικασία μοιάζει με το φιλτράρισμα ανεπιθύμητης αλληλογραφίας στο email: το εργαλείο συγκρίνει το νέο κείμενο με όσα έχει εξετάσει στο παρελθόν και αποφασίζει σε ποια κατηγορία ταιριάζει περισσότερο. Αυτή η μέθοδος μπορεί να λειτουργήσει ακόμη και χωρίς γνώση του συγκεκριμένου εργαλείου ΑΙ που παρήγαγε το κείμενο, αρκεί το εκπαιδευτικό υλικό να είναι επαρκώς ποικιλόμορφο.
Όταν, όμως, υπάρχει πρόσβαση στα ίδια τα γλωσσικά μοντέλα που δημιουργούν κείμενα, μπορεί να χρησιμοποιηθεί μια διαφορετική στρατηγική: η αναζήτηση στατιστικών μοτίβων που συνδέονται με τον τρόπο παραγωγής γλώσσας συγκεκριμένων μοντέλων. Αν ένα μοντέλο αποδίδει ασυνήθιστα υψηλή πιθανότητα σε μια ακριβή ακολουθία λέξεων, αυτό μπορεί να αποτελεί ένδειξη ότι το ίδιο παρήγαγε το κείμενο. Τέλος, στην περίπτωση υδατογραφημένων κειμένων, η διαδικασία μετατρέπεται από ανίχνευση σε επαλήθευση, βασισμένη σε πληροφορίες που δεν προκύπτουν αποκλειστικά από το ίδιο το κείμενο.
Οι περιορισμοί των εργαλείων ανίχνευσης
Καμία από τις προσεγγίσεις δεν υπερέχει απόλυτα. Οι ανιχνευτές που βασίζονται σε εκπαίδευση χάνουν ακρίβεια όταν τα νέα κείμενα αποκλίνουν από τα δεδομένα εκπαίδευσης, τα οποία γρήγορα παλιώνουν καθώς εμφανίζονται νέα μοντέλα ΑΙ. Η συνεχής ανανέωση δεδομένων είναι δαπανηρή και οι ανιχνευτές αναπόφευκτα υστερούν σε σχέση με τα συστήματα που καλούνται να αναγνωρίσουν.
Οι στατιστικές μέθοδοι εξαρτώνται από παραδοχές για τον τρόπο λειτουργίας συγκεκριμένων μοντέλων ή από πρόσβαση σε εσωτερικές πληροφορίες τους. Όταν τα μοντέλα είναι ιδιόκτητα ή αλλάζουν συχνά, οι μέθοδοι αυτές καθίστανται αναξιόπιστες. Η υδατογράφηση, τέλος, προϋποθέτει συνεργασία των εταιρειών ΑΙ και εφαρμόζεται μόνο όταν έχει ενεργοποιηθεί εξαρχής.
Καθώς η κοινωνία προσαρμόζεται στην παραγωγική τεχνητή νοημοσύνη (generative AI), οι κανόνες και οι τεχνικές ανίχνευσης θα εξελίσσονται. Ωστόσο, θα πρέπει να γίνει αποδεκτό ότι τα εργαλεία αυτά δεν θα είναι ποτέ απολύτως αλάνθαστα.









