Tuesday, July 1, 2025
  • About Us
  • Contact Us
  • Terms and Conditions
  • Privacy Policy
  • Disclaimer
Earn EDU
  • Home
  • Business
  • Health
  • Gaming
  • Economy
  • Technology
  • Gadgets
  • Lifestyle
  • Sports
  • World
  • Travel
No Result
View All Result
Earn EDU
Home Technology

Ποιος πράκτορας τεχνητής νοημοσύνης είναι ο καλύτερος; Αυτός ο νέος πίνακας ηγετών μπορεί να σας πει

Jessica Thompson by Jessica Thompson
February 15, 2025
in Technology
0
Ποιος πράκτορας τεχνητής νοημοσύνης είναι ο καλύτερος; Αυτός ο νέος πίνακας ηγετών μπορεί να σας πει
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter
Έκρηξη τεχνολογιών χρώματος

Maciej Frolow/Getty Images

Τι θα μπορούσε να είναι καλύτερο από μια συνομιλία -και ποιος μπορεί να εκτελέσει εργασίες για εσάς; AI, που μπορεί να εκτελέσει καθήκοντα για εσάς μόνοι σας.

Related posts

Βρήκα ένα προσιτό OLED -NOTEBK με εξαιρετικά χαρακτηριστικά για εργασία και ταξίδια – και είναι προς πώληση

Βρήκα ένα προσιτό OLED -NOTEBK με εξαιρετικά χαρακτηριστικά για εργασία και ταξίδια – και είναι προς πώληση

April 8, 2025
Οι τεχνικοί αγοραστές των δασμών, οι οποίοι αναρωτιούνται τι θα συμβεί στη συνέχεια. Αυτό γνωρίζουμε

Οι τεχνικοί αγοραστές των δασμών, οι οποίοι αναρωτιούνται τι θα συμβεί στη συνέχεια. Αυτό γνωρίζουμε

April 8, 2025

Οι πράκτορες AI είναι τα νεότερα σύνορα στο χώρο AI. Οι εταιρείες τεχνητής νοημοσύνης συμμετέχουν σε αγώνες για να δημιουργήσουν τα δικά τους μοντέλα και οι προσφορές διανέμονται συνεχώς στις επιχειρήσεις. Αλλά ποιος πράκτορας της τεχνητής νοημοσύνης είναι ο καλύτερος;

Επίσης: Η κύρια λειτουργία των δίδυμων είναι τώρα δωρεάν για όλους τους χρήστες – η διευρυμένη συνδρομή δεν απαιτείται

Πίνακας ηγετών Galileo

Την Τετάρτη, το Galileo ξεκίνησε έναν πίνακα ηγετών των πράκτορα σε ένα αγκάλιασμα, μια πλατφόρμα τεχνητής νοημοσύνης ανοιχτού κώδικα όπου οι χρήστες μπορούν να δημιουργήσουν, να εκπαιδεύσουν, να έχουν πρόσβαση και να επεκτείνουν τα μοντέλα τεχνητής νοημοσύνης. Ο πίνακας Leaders έχει σχεδιαστεί για να βοηθήσει τους ανθρώπους να μάθουν πώς εργάζονται οι πράκτορες τεχνητής νοημοσύνης σε πραγματικές επιχειρηματικές εφαρμογές και βοηθούν τις ομάδες να καθορίσουν ποιος πράκτορας αντιστοιχεί καλύτερα στις ανάγκες τους.

📊 Ο πίνακας των ηγετών των πράκτορά μας 𝗹𝗶𝘃𝗲! Κατασκευάσαμε ένα πολύπλοκο πρότυπο από το οποίο το LLMS είναι το καλύτερο κατάλληλο για πράκτορες τεχνητής νοημοσύνης 👀
Μετά την αξιολόγηση 17 κορυφαίων LLMs σε 14 διαφορετικά σύνολα δεδομένων, είμαστε στην ευχάριστη θέση να μοιραστούμε τα συμπεράσματά μας σχετικά με τα μοντέλα που είναι πραγματικά επιτυχημένα στην απόκτηση εργαλείων και είναι έτοιμα για … pic.twitter.com/cgw2iwnsa7

– 🔭 Galileo (@Rungalileo) 12 Φεβρουαρίου 2025

Στον πίνακα Leaders, μπορείτε να βρείτε πληροφορίες σχετικά με την απόδοση του μοντέλου, συμπεριλαμβανομένου του τίτλου και της αξιολόγησης. Με την πρώτη ματιά, μπορείτε επίσης να δείτε περισσότερες βασικές πληροφορίες σχετικά με το μοντέλο, συμπεριλαμβανομένου του προμηθευτή, του κόστους και του αν με ανοιχτή πηγή ή ιδιωτική.

Επί του παρόντος, ο πίνακας ηγεσίας περιλαμβάνει “17 κορυφαία LLM”, συμπεριλαμβανομένων των μοντέλων Google, OpenAI, Mistral, Anpropic και Meta. Ενημερώνεται κάθε μήνα για να συμβαδίζει με τα συνεχιζόμενα θέματα που βρίσκονται συχνά.

Πώς κατατάσσονται τα μοντέλα

Για να προσδιοριστεί τα αποτελέσματα, το Galileo χρησιμοποιεί σύνολα δεδομένων ανάλυσης δεδομένων, συμπεριλαμβανομένου του BFCL (Berkeley Function Calling Boarde), του T Bench (Tau Bender), του Xlam και του Toolace, οι οποίες ελέγχουν τις διάφορες ευκαιρίες του πράκτορα. Στη συνέχεια, οι πίνακες των ηγετών μετατρέπουν αυτά τα δεδομένα σε μια δομή αξιολόγησης που καλύπτει τις επιλογές πραγματικής χρήσης.

Επίσης: 3 λαμπρά πλευρικά πλοία που μπορείτε να ξεκινήσετε με τον χειριστή OpenAI αυτή τη στιγμή

“Το BFCL υπερβαίνει τους ακαδημαϊκούς τομείς, όπως τα μαθηματικά, η ψυχαγωγία και η εκπαίδευση, το τμμάν ειδικεύεται σε σενάρια λιανικής και αεροπορικής εταιρείας, το Xlam φωτίζει τη δημιουργία δεδομένων σε 21 τομείς και η εργαλειοθήκη επικεντρώνεται στις αλληλεπιδράσεις API σε 390 τομείς”, εξηγεί η εταιρεία σε το blog. Πεδίο

Το Galileo προσθέτει ότι κάθε μοντέλο υποβάλλεται σε άγχος για να μετρήσει τα πάντα, από απλές κλήσεις API σε πιο προηγμένες εργασίες, όπως πολυεπιστημονικές αλληλεπιδράσεις. Η εταιρεία μοιράστηκε επίσης τη μεθοδολογία της, εξασφαλίζοντας στους χρήστες ότι χρησιμοποιεί μια τυποποιημένη μεθοδολογία στη δικαιοσύνη για την αξιολόγηση όλων των πρακτόρων τεχνητής νοημοσύνης. Η θέση περιλαμβάνει περισσότερη τεχνική εμβάπτιση στην βαθμολογία μοντέλου.

Ακροαματικότητα

Το Flash Google Gemini-2,0 είναι στην πρώτη θέση, ακολουθούμενη από το GPT-4O OpenAI. Και τα δύο αυτά μοντέλα έλαβαν αυτό που ο Galileo ονομάζει την κατάσταση της “Elite Performance”, η οποία μεταδίδεται σε μοντέλα με βαθμολογία 0,9 ή υψηλότερη. Η Google και η OpenAI κυριάρχησαν στον πίνακα ηγετών με τα ιδιωτικά μοντέλα τους, λαμβάνοντας τις πρώτες έξι θέσεις.

Το Google Gemini 2.0 ήταν συνεπές σε όλες τις κατηγορίες αξιολόγησης και μια ισορροπημένη εντυπωσιακή απόδοση σε όλες τις κατηγορίες με οικονομική απόδοση, σύμφωνα με τη θέση, αξίας 0,15 δολαρίων/US $ 06 για μάρκες. Αν και το GPT-4O ήταν το επόμενο δευτερόλεπτο, έχει πολύ υψηλότερη τιμή $ 2,5/$ 10 για μάρκες.

Στο “τμήμα υψηλής απόδοσης”, κατηγορίες σε επίπεδο ελίτ, το δίδυμο-1.5-flash κατέκτησε την τρίτη θέση και το Gemini-1.5-Pro-τέταρτο. Τα μοντέλα συλλογισμού OpenAI, O1 και O3-Mini ακολούθησαν στην πέμπτη και την έκτη θέση, αντίστοιχα.

Το Mistral-Small-2501 ήταν το πρώτο μοντέλο ενός κώδικα ανοιχτού κώδικα για το γράφημα. Η βαθμολογία του 0,832 το έθεσε στην κατηγορία των “Mid -Level Pominess of”. Οι εκτιμήσεις έδειξαν ότι τα πλεονεκτήματά του είναι ισχυρές δυνατότητες επεξεργασίας με ένα μακρύ πλαίσιο και την επιλογή των εργαλείων.

Πώς να έχετε πρόσβαση

Για να δείτε τα αποτελέσματα, μπορείτε να επισκεφθείτε τον πίνακα ηγετών του πράκτορα για να αγκαλιάσετε το πρόσωπο. Εκτός από τον πίνακα Standard Leaders, μπορείτε να φιλτράρετε τον πίνακα ηγετών από το αν το LLM είναι ανοιχτό ή ιδιωτικό. Και με μια κατηγορία που αναφέρεται στη δυνατότητα δοκιμής (γενικά, ένα μακρύ πλαίσιο, σύνθετο, κλπ.).

Previous Post

Γνωρίζουμε κυρίως πότε θα βγει τώρα το GTA 6

Next Post

Οι λιανικές πωλήσεις μειώθηκαν κατά 0,9% τον Ιανουάριο, κάτι που ήταν πολύ περισσότερο από το αναμενόμενο

Next Post
Οι λιανικές πωλήσεις μειώθηκαν κατά 0,9% τον Ιανουάριο, κάτι που ήταν πολύ περισσότερο από το αναμενόμενο

Οι λιανικές πωλήσεις μειώθηκαν κατά 0,9% τον Ιανουάριο, κάτι που ήταν πολύ περισσότερο από το αναμενόμενο

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

RECOMMENDED NEWS

Η σειρά κινουμένων σχεδίων του Amazon μοιάζει με διαφήμιση

Η σειρά κινουμένων σχεδίων του Amazon μοιάζει με διαφήμιση

7 months ago
Ο αναλυτής λέει ότι ο Warren Buffett είδε ότι η πώληση συσσωρεύτηκε σε μετρητά, καθώς οι αγορές αναμένουν το επόμενο βήμα του – “η υπομονή είναι κάτι περισσότερο από αρετή, αυτό το όπλο”

Ο αναλυτής λέει ότι ο Warren Buffett είδε ότι η πώληση συσσωρεύτηκε σε μετρητά, καθώς οι αγορές αναμένουν το επόμενο βήμα του – “η υπομονή είναι κάτι περισσότερο από αρετή, αυτό το όπλο”

4 months ago
BGIS 2025 Ημέρα 3 ημέρας.

BGIS 2025 Ημέρα 3 ημέρας.

3 months ago
Το ραδιόφωνο με ζαμπόν εξακολουθεί να είναι σανίδα σωτηρίας ακόμα και στην εποχή του iPhone – να γιατί

Το ραδιόφωνο με ζαμπόν εξακολουθεί να είναι σανίδα σωτηρίας ακόμα και στην εποχή του iPhone – να γιατί

6 months ago

BROWSE BY CATEGORIES

  • Business
  • Economy
  • Gadgets
  • Gaming
  • Health
  • Lifestyle
  • Sports
  • Technology
  • Travel
  • World

POPULAR NEWS

  • Το 40% των παγκόσμιων αναγκών σε νερό θα παραμείνει ανεκπλήρωτο μέχρι το 2030 λόγω της παύσης της ανάπτυξης της τεχνολογίας αφαλάτωσης

    Το 40% των παγκόσμιων αναγκών σε νερό θα παραμείνει ανεκπλήρωτο μέχρι το 2030 λόγω της παύσης της ανάπτυξης της τεχνολογίας αφαλάτωσης

    0 shares
    Share 0 Tweet 0
  • Το Astro Bot έχει ένα εκπληκτικό ανεξερεύνητο επίπεδο με τόνους μυστικών αυγών

    0 shares
    Share 0 Tweet 0
  • Μια προσέγγιση με γνώμονα τα δεδομένα για την εταιρική διακυβέρνηση

    0 shares
    Share 0 Tweet 0
  • Μόλις γελοιοποιήθηκε για το ύψος του, ο «ζεστός» παρααθλητής αναγκάζει άλλους να κάθονται στις μύτες των ποδιών τους

    0 shares
    Share 0 Tweet 0
  • Το Grand Theft Auto 6 δεν θα επηρεαστεί από την απεργία των ηθοποιών

    0 shares
    Share 0 Tweet 0

Our mission is to deliver accurate, timely, and comprehensive news coverage that keeps our readers informed and engaged. We strive to provide a balanced perspective on the latest events and issues shaping our world, offering insightful analysis and in-depth reporting on a wide range of topics.

Follow us on social media:

Recent News

  • Φασισμός, δεξιά και αριστερά
  • Η εβδομαδιαία ανάγνωσή μου στις 29 Ιουνίου 2025
  • Δύο ατυχήματα έκτακτης ανάγκης – econlib

Category

  • Business
  • Economy
  • Gadgets
  • Gaming
  • Health
  • Lifestyle
  • Sports
  • Technology
  • Travel
  • World

World News

Ο αγώνας Paul εναντίον Tyson σπάει το ρεκόρ για το μεγαλύτερο αγώνισμα πυγμαχίας εκτός Βέγκας

Ο αγώνας Paul εναντίον Tyson σπάει το ρεκόρ για το μεγαλύτερο αγώνισμα πυγμαχίας εκτός Βέγκας

November 16, 2024
Συμβουλές για αρχάριους Veilguard και άλλες συμβουλές για παιχνίδια

Συμβουλές για αρχάριους Veilguard και άλλες συμβουλές για παιχνίδια

November 3, 2024
  • About Us
  • Contact Us
  • Terms and Conditions
  • Privacy Policy
  • Disclaimer

© 2024 Top Notiz . All Rights Reserved.

No Result
View All Result
  • Home
  • Business
  • Health
  • Gaming
  • Economy
  • Technology
  • Gadgets
  • Lifestyle
  • Sports
  • World
  • Travel

© 2024 Top Notiz . All Rights Reserved.