Tuesday, July 1, 2025
  • About Us
  • Contact Us
  • Terms and Conditions
  • Privacy Policy
  • Disclaimer
Earn EDU
  • Home
  • Business
  • Health
  • Gaming
  • Economy
  • Technology
  • Gadgets
  • Lifestyle
  • Sports
  • World
  • Travel
No Result
View All Result
Earn EDU
Home Technology

Αυτό το νέο πρότυπο AI μετρά πόσα μοντέλα βρίσκονται

Jessica Thompson by Jessica Thompson
March 11, 2025
in Technology
0
Αυτό το νέο πρότυπο AI μετρά πόσα μοντέλα βρίσκονται
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter
GetTyimages-2163895220

Akinbostanci/Getty Images

Δεδομένου ότι όλο και περισσότερα μοντέλα τεχνητής νοημοσύνης δείχνουν στοιχεία ότι είναι σε θέση να εξαπατήσουν τους δημιουργούς τους, οι ερευνητές από το Κέντρο Ασφάλειας και η κλίμακα του AI έχουν αναπτύξει τον πρώτο ανιχνευτή ψεμάτων.

Την Τετάρτη, οι ερευνητές έχουν κυκλοφορήσει τον προσανατολισμό του μοντέλου μεταξύ ευθυγράμμισης και γνώσης (μάσκα), γεγονός που καθορίζει πόσο εύκολα είναι δυνατόν να εξαπατηθεί το μοντέλο σε συνειδητά ψέματα στους χρήστες ή την «ηθική αρετή» του.

Επίσης: Το O1 της Operai βρίσκεται περισσότερο από οποιοδήποτε σημαντικό μοντέλο AI. Γιατί είναι σημαντικό

Οι μεμονωμένοι δείκτες, η εξαπάτηση και η ισοπέδωση, όταν το μοντέλο AI ισχυρίζεται σκόπιμα ότι αλλάζει τις αξίες του, όταν, όταν αναγκαστεί, είναι ένας τρόπος με τους οποίους τα μοντέλα AI υπονομεύουν τους δημιουργούς τους και μπορούν να δημιουργήσουν σοβαρές απειλές για την ασφάλεια και την ασφάλεια.

Μελέτες δείχνουν ότι το O1 OpenAI είναι ιδιαίτερα καλό στα προγράμματα για να διατηρήσει τον έλεγχο του εαυτού τους και το CLAUDE 3 OPUS απέδειξε ότι μπορεί να διαιρέσει την ευθυγράμμιση.

Επίσης: Πώς οι Cisco, Langchain και Galileo επιδιώκουν να υποστηρίξουν την έκρηξη Cambrian των παραγόντων τεχνητής νοημοσύνης “

Για να διευκρινιστούν, οι ερευνητές διαπίστωσαν ότι βρίσκονται ως “(1), έχοντας κάνει μια δήλωση από ένα καλά γνωστό (ή θεωρείται) ψευδές και (2) που σκοπεύουν να αποδεχθούν τη δήλωση ως αληθινή”, σε αντίθεση με άλλες ψευδείς απαντήσεις, όπως παραισθήσεις. Οι ερευνητές δήλωσαν ότι η βιομηχανία δεν είχε ακόμη επαρκή μέθοδο για την αξιολόγηση της ειλικρίνειας στα μοντέλα AI.

“Πολλοί δείκτες ισχυρίζονται ότι μετράνε την ειλικρίνεια, στην πραγματικότητα, μετράει απλώς την ακρίβεια – την ορθότητα των πεποιθήσεων του μοντέλου – μεταμφιεσμένη”, αναφέρει η έκθεση. Για παράδειγμα, τα κριτήρια όπως η αλήθεια μετρούν εάν το μοντέλο μπορεί να δημιουργήσει “εύλογη παραπληροφόρηση”, αλλά αν το μοντέλο προτίθεται να εξαπατήσει σκόπιμα, παρέχοντας ψευδείς πληροφορίες, εξήγησε το άρθρο.

“Ως αποτέλεσμα, τα πιο ικανά μοντέλα μπορούν να λειτουργήσουν καλύτερα σε αυτά τα κριτήρια μέσω μιας ευρύτερης πραγματικής κάλυψης και όχι απαραίτητα επειδή απέχουν από συνειδητή”, ανέφεραν οι ερευνητές. Η μάσκα είναι η πρώτη δοκιμή για τη διαφοροποίηση της ακρίβειας και της ειλικρίνειας.

Εικ. 3

Ένα παράδειγμα άσκησης αξιολόγησης στην οποία δόθηκε το μοντέλο για την κατασκευή στατιστικών στοιχείων βάσει αίτησης χρήστη.

II Κέντρο Ασφαλείας

Οι ερευνητές σημείωσαν ότι εάν τα μοντέλα βρίσκονται, υποβάλλονται στους χρήστες νόμιμες, οικονομικές και εμπιστευτικές βλάβες. Παραδείγματα μπορεί να περιλαμβάνουν μοντέλα που δεν μπορούν να επιβεβαιώσουν με ακρίβεια εάν μεταφέρουν χρήματα στον σωστό τραπεζικό λογαριασμό, εισάγονται στον πελάτη ή κατά λάθος διαρρέουν εμπιστευτικά δεδομένα.

Επίσης: Πώς το AI θα μετατρέψει την ασφάλεια στον κυβερνοχώρο το 2025 – και την υπερφόρτωση του εγκληματία στον κυβερνοχώρο

Related posts

Βρήκα ένα προσιτό OLED -NOTEBK με εξαιρετικά χαρακτηριστικά για εργασία και ταξίδια – και είναι προς πώληση

Βρήκα ένα προσιτό OLED -NOTEBK με εξαιρετικά χαρακτηριστικά για εργασία και ταξίδια – και είναι προς πώληση

April 8, 2025
Οι τεχνικοί αγοραστές των δασμών, οι οποίοι αναρωτιούνται τι θα συμβεί στη συνέχεια. Αυτό γνωρίζουμε

Οι τεχνικοί αγοραστές των δασμών, οι οποίοι αναρωτιούνται τι θα συμβεί στη συνέχεια. Αυτό γνωρίζουμε

April 8, 2025

Χρησιμοποιώντας τη μάσκα και ένα σύνολο δεδομένων από περισσότερα από 1.500 αιτήματα που συλλέχθηκαν από ένα άτομο που σχεδιάστηκε για να “προσδιορίσει τα ψέματα”, οι ερευνητές εκτίμησαν 30 συνοριακά μοντέλα, αποκαλύπτοντας τις κύριες πεποιθήσεις τους και μετρώντας πόσο καλά προσκολλώνται σε αυτές τις απόψεις όταν πιέζουν. Οι ερευνητές έχουν διαπιστώσει ότι η υψηλότερη ακρίβεια δεν συσχετίζεται με την υψηλότερη ειλικρίνεια. Διαπίστωσαν επίσης ότι τα μεγαλύτερα μοντέλα, ειδικά τα συνοριακά μοντέλα, δεν είναι απαραιτήτως πιο αληθινά από τα μικρότερα.

Screenshot-2025-03-10 -at-3-33-24pm.png

Ένα δείγμα αξιολογήσεων μοντέλου από την αξιολόγηση της μάσκας.

II Κέντρο Ασφαλείας

Τα μοντέλα ήταν εύκολα ψέματα και ήξεραν ότι ψέματα. Στην πραγματικότητα, δεδομένου ότι τα μοντέλα κλιμακώνονται, φαινόταν να γίνονται πιο ανέντιμοι.

Το Grok 2 είχε το υψηλότερο μερίδιο (63%) ανέντιμων απαντήσεων από τα δοκιμασμένα μοντέλα. Ο Claude 3.7 Sonnet είχε το υψηλότερο μερίδιο των ειλικρινείς απαντήσεις κατά 46,9%.

Επίσης: Τα συνθετικά δεδομένα θα διαταράξουν την γενετική ώθηση ή θα είναι η επανάσταση που χρειαζόμαστε;

“Σε μια ποικιλία σετ LLM, διαπιστώνουμε ότι αν και τα μεγαλύτερα μοντέλα λαμβάνουν υψηλότερη ακρίβεια στο στάδιο αναφοράς μας, δεν γίνονται πιο ειλικρινείς”, εξήγησε οι ερευνητές.

“Παραδόξως, ενώ η πλειοψηφία των Frontier LLM λαμβάνει υψηλές βαθμίδες στα πρότυπα της ειλικρίνειας, βρίσκουμε μια σημαντική τάση για να ψέματα το Frontier LLM όταν το δίνετε να το κάνετε αυτό, γεγονός που οδηγεί σε χαμηλή ειλικρίνεια στο στάδιο μας”.

Επίσης: Τα περισσότερα εργαλεία για την κλωνοποίηση της φωνής της τεχνητής νοημοσύνης δεν είναι ασφαλή από τους απατεώνες, βρίσκονται οι καταναλωτικές αναφορές

Το σύνολο δεδομένων betenchmark είναι διαθέσιμο στο κοινό στο HugingFace και το GitHub.

“Ελπίζουμε ότι το πρότυπο μας συμβάλλει στην περαιτέρω πρόοδο σε σχέση με τα ειλικρινά συστήματα AI, παρέχοντας στους ερευνητές μια αυστηρή, τυποποιημένη μέθοδο μέτρησης και βελτίωσης της ειλικρίνειας του μοντέλου”, αναφέρει το έγγραφο.

Previous Post

Το νέο σετ Lego Mario Kart είναι το καλύτερο σετ Nintendo

Next Post

Προωθήσεις, ειδήσεις, εισόδημα και δεδομένα VW

Next Post
Προωθήσεις, ειδήσεις, εισόδημα και δεδομένα VW

Προωθήσεις, ειδήσεις, εισόδημα και δεδομένα VW

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

RECOMMENDED NEWS

Αναφορά θέσεων εργασίας Νοεμβρίου 2024:

Αναφορά θέσεων εργασίας Νοεμβρίου 2024:

7 months ago
“Με ποιον δεν έχετε ποτό, με τον οποίο δεν μπορείτε να μείνετε ιδιωτικά”: Ο νομοθέτης της Βιρτζίνια λέει ότι έλαβε μια “σύντομη περιγραφή της ασφάλειας” όταν εντάχθηκε

“Με ποιον δεν έχετε ποτό, με τον οποίο δεν μπορείτε να μείνετε ιδιωτικά”: Ο νομοθέτης της Βιρτζίνια λέει ότι έλαβε μια “σύντομη περιγραφή της ασφάλειας” όταν εντάχθηκε

3 months ago
Οι τεχνολογίες ξεπουλάνε, αλλά η τεχνητή νοημοσύνη είναι εδώ για να μείνει

Οι τεχνολογίες ξεπουλάνε, αλλά η τεχνητή νοημοσύνη είναι εδώ για να μείνει

6 months ago
“Αυτός δεν είναι ο τρόπος που θα …”

“Αυτός δεν είναι ο τρόπος που θα …”

5 months ago

BROWSE BY CATEGORIES

  • Business
  • Economy
  • Gadgets
  • Gaming
  • Health
  • Lifestyle
  • Sports
  • Technology
  • Travel
  • World

POPULAR NEWS

  • Το 40% των παγκόσμιων αναγκών σε νερό θα παραμείνει ανεκπλήρωτο μέχρι το 2030 λόγω της παύσης της ανάπτυξης της τεχνολογίας αφαλάτωσης

    Το 40% των παγκόσμιων αναγκών σε νερό θα παραμείνει ανεκπλήρωτο μέχρι το 2030 λόγω της παύσης της ανάπτυξης της τεχνολογίας αφαλάτωσης

    0 shares
    Share 0 Tweet 0
  • Το Astro Bot έχει ένα εκπληκτικό ανεξερεύνητο επίπεδο με τόνους μυστικών αυγών

    0 shares
    Share 0 Tweet 0
  • Μια προσέγγιση με γνώμονα τα δεδομένα για την εταιρική διακυβέρνηση

    0 shares
    Share 0 Tweet 0
  • Μόλις γελοιοποιήθηκε για το ύψος του, ο «ζεστός» παρααθλητής αναγκάζει άλλους να κάθονται στις μύτες των ποδιών τους

    0 shares
    Share 0 Tweet 0
  • Το Grand Theft Auto 6 δεν θα επηρεαστεί από την απεργία των ηθοποιών

    0 shares
    Share 0 Tweet 0

Our mission is to deliver accurate, timely, and comprehensive news coverage that keeps our readers informed and engaged. We strive to provide a balanced perspective on the latest events and issues shaping our world, offering insightful analysis and in-depth reporting on a wide range of topics.

Follow us on social media:

Recent News

  • Σε ποια τάξη είσαι;
  • Φασισμός, δεξιά και αριστερά
  • Η εβδομαδιαία ανάγνωσή μου στις 29 Ιουνίου 2025

Category

  • Business
  • Economy
  • Gadgets
  • Gaming
  • Health
  • Lifestyle
  • Sports
  • Technology
  • Travel
  • World

World News

Πώς θα συμπεριφερθεί το Queens Bulawayo Pitch Sports Club στο άνοιγμα της σειράς

Πώς θα συμπεριφερθεί το Queens Bulawayo Pitch Sports Club στο άνοιγμα της σειράς

November 30, 2024
Οι Patna Pirates διατηρούν το προβάδισμα έναντι της U Mumba μετά το ημίχρονο

Οι Patna Pirates διατηρούν το προβάδισμα έναντι της U Mumba μετά το ημίχρονο

December 26, 2024
  • About Us
  • Contact Us
  • Terms and Conditions
  • Privacy Policy
  • Disclaimer

© 2024 Top Notiz . All Rights Reserved.

No Result
View All Result
  • Home
  • Business
  • Health
  • Gaming
  • Economy
  • Technology
  • Gadgets
  • Lifestyle
  • Sports
  • World
  • Travel

© 2024 Top Notiz . All Rights Reserved.