
Η πλατφόρμα μηχανικής δεδομένων της Encord υπερβαίνει την επιχειρηματική ευφυΐα για να γίνει «η μόνη πολυτροπική πλατφόρμα μηχανικής δεδομένων AI στον κόσμο».
Την Πέμπτη, η εταιρεία ανακοίνωσε νέες δυνατότητες πολυτροπικού σχολιασμού δεδομένων για ταξινόμηση ήχου και εγγράφων, όλα σε μία διεπαφή. Η ενημέρωση επεκτείνει την υπάρχουσα υποστήριξη της Encord για ιατρικά δεδομένα, δεδομένα όρασης υπολογιστή και βίντεο.
Επίσης: Δοκίμασα πολλά εργαλεία τεχνητής νοημοσύνης για εργασία. Αυτοί οι 4 βαθμοί με βοηθούν πραγματικά να κάνω περισσότερα κάθε μέρα
Σήμερα, τα chatbot AI και οι γεννήτριες εικόνων έχουν γίνει σχετικά συνηθισμένα. Αλλά η δημιουργία συναρπαστικού βίντεο ή ήχου είναι πολύ πιο δύσκολη από τη δημιουργία κειμένου. Ο κλάδος της τεχνητής νοημοσύνης εστιάζει όλο και περισσότερο στις πολυτροπικές δυνατότητες, ειδικά με την εισαγωγή χαρακτηριστικών όπως η λειτουργία φωνής ChatGPT.
Για να τελειοποιήσετε ένα μοντέλο τεχνητής νοημοσύνης, χρειάζεστε δεδομένα υψηλής ποιότητας και μερικές φορές υπερειδικά. Τα δεδομένα κειμένου δεν παρέχουν την απόχρωση που απαιτούν αυτά τα πολύπλοκα μοντέλα και η ακρίβεια είναι ακόμη πιο σημαντική σε ευαίσθητα πλαίσια όπως η ιατρική. Οι κατασκευαστές χρειάζονται πλατφόρμες που μπορούν να σχολιάσουν και να αξιολογήσουν όλους τους τύπους δεδομένων—βίντεο, ήχο, εικόνες, γραφήματα, αναφορές, καταχωρίσεις λιανικής, PDF και άλλα, ιδανικά σε ένα μέρος. Ορισμένοι πελάτες της Encord χρησιμοποιούν την πλατφόρμα για ιατρική απεικόνιση, όπως μαγνητικές τομογραφίες, για να αναπτύξουν καλύτερα μοντέλα για να βοηθήσουν τους γιατρούς.
Η ύπαρξη δεδομένων ήχου υψηλής ποιότητας και καλά σχολιασμένα βοηθά στη δημιουργία μοντέλων αναγνώρισης ομιλίας και συναισθημάτων, ακόμη και αναγνώρισης ήχου. Τα προϊόντα βίντεο και ήχου με τεχνητή νοημοσύνη απαιτούν ολοένα και πιο εξελιγμένη υποστήριξη δεδομένων για την επίτευξη ρεαλισμού που μοιάζει με τον άνθρωπο, είτε πρόκειται για ακρίβεια μεταγραφής είτε για ακρίβεια χειλικού συγχρονισμού. Για παράδειγμα, η πλατφόρμα Synthesia από κείμενο σε βίντεο με τεχνητή νοημοσύνη χρησιμοποιεί το Encord για να αναπτύξει μοντέλα εκμάθησης για τα ρεαλιστικά της avatar AI.
Η ενημέρωση Encord περιλαμβάνει νέες δυνατότητες για σχολιασμό και επιμέλεια εγγράφων, αρχείων ήχου, εικόνων και ιατρικών δεδομένων. Με πολυτροπικούς σχολιασμούς, οι ομάδες τεχνητής νοημοσύνης μπορούν να προσαρμόσουν τη διεπαφή για την προβολή και την επεξεργασία διαφορετικών τύπων αρχείων ταυτόχρονα. Επί του παρόντος, διαφορετικοί τύποι δεδομένων είναι συχνά διάσπαρτοι σε πολλές υπηρεσίες και πλατφόρμες, αυξάνοντας τον χρόνο και το κόστος του σχολιασμού των δεδομένων. Το Encord υποστηρίζει ήδη βασικές κατηγορίες σχολιασμού δεδομένων, όπως αναγνώριση αντικειμένων, μετάφραση, σύνοψη, ταξινόμηση κειμένου και ανάλυση συναισθήματος.
«Οι ομάδες είναι χρονοβόρες και συχνά αδυνατούν να αποκτήσουν γνώσεις για σύνολα δεδομένων μεγάλης κλίμακας σε όλη τη διαδικασία ανάπτυξης του μοντέλου λόγω έλλειψης ενοποίησης και συνεπούς διεπαφής για την ενοποίηση αυτών των διαφορετικών εργαλείων», είπε η εταιρεία.
Επίσης: Οι οργανισμοί αντιμετωπίζουν αυξανόμενη πίεση για να επιταχύνουν τα σχέδια τεχνητής νοημοσύνης παρά την έλλειψη απόδοσης επένδυσης (ROI).
Με το Encord, οι ομάδες τεχνητής νοημοσύνης μπορούν να φιλτράρουν τα δεδομένα τους για να εντοπίσουν και να επιλέξουν ακριβώς αυτό που χρειάζονται για την κατασκευή ενός μοντέλου. Ο πίνακας εργαλείων βαθμολογίας του μπορεί επίσης να επισημάνει δεδομένα που υποβαθμίζουν την απόδοση του μοντέλου, ώστε οι ομάδες να μπορούν να τα αφαιρέσουν ή να τα αντικαταστήσουν.
«Κατά μέσο όρο, οι πελάτες του Encord χρησιμοποιούν 35% μικρότερα σύνολα δεδομένων, με αποτέλεσμα μοντέλα να είναι 20% πιο ακριβή», είπε στο ZDNET μέσω email ένας εκπρόσωπος της Encord.
Στο demo, ο συνιδρυτής και πρόεδρος της Encord, Ulrik Stig Hansen, δήλωσε στο ZDNET ότι πιστεύει ότι η εστίαση της εταιρείας στην ποιότητα και τη συγκέντρωση θα οδηγήσει τελικά στη δημιουργία τεχνητής γενικής νοημοσύνης (AGI).