Το νέο AI μοντέλο QwQ-32B-Preview της Alibaba υπερέχει σε ορισμένα benchmarks από τα μοντέλα της OpenAI

Το τελευταίο μοντέλο της Alibaba, QwQ-32B-Preview, αναφέρεται ότι υπερτερεί των μοντέλων o1-preview και o1-mini της OpenAI σε συγκεκριμένα benchmarks, όπως τα τεστ AIME και MATH, που αξιολογούν την απόδοση σε λογικά παζλ και μαθηματικά προβλήματα.

Η Alibaba έχει διαθέσει το QwQ-32B-Preview για λήψη. Σύμφωνα με την εταιρεία, το νέο της μοντέλο είναι ικανό να διαχειριστεί πιο περίπλοκα προβλήματα σε σύγκριση με παραδοσιακά μεγάλα γλωσσικά μοντέλα (LLMs) όπως το ChatGPT-4 και το Claude 3.5.

Όπως αναφέρει η Benzinga, το QwQ-32B-Preview είναι ένα από τα λίγα διαθέσιμα μοντέλα με άδεια χρήσης που επιτρέπει στους χρήστες να το κατεβάζουν και να το χρησιμοποιούν. Το μοντέλο είναι πλέον διαθέσιμο στην πλατφόρμα ανάπτυξης AI Hugging Face.

Ωστόσο, η Alibaba κυκλοφόρησε μόνο ορισμένα στοιχεία του μοντέλου για να περιορίσει την πλήρη αντιγραφή ή την κατανόηση του τρόπου λειτουργίας του.

Το νέο μοντέλο της Alibaba διαθέτει 32,5 δισεκατομμύρια παραμέτρους, επιτρέποντάς του να χειρίζεται αιτήματα έως και 32.000 λέξεων. Με τις σημαντικές δυνατότητες και τη μερικώς ανοιχτή προσβασιμότητά του, το QwQ-32B-Preview δημιουργεί τις βάσεις για μια μετασχηματιστική πρόοδο στις τεχνολογίες συλλογιστικής AI.

Σε αντίθεση με την Alibaba, η OpenAI κρατά μυστικά τα δεδομένα για τις παραμέτρους των μοντέλων της.

Το νέο μοντέλο έρχεται σε μια εποχή που η OpenAI σημειώνει μεγάλες επιτυχίες στον τομέα της AI. Τον Οκτώβριο, η OpenAI έφτασε σε αποτίμηση 157 δισεκατομμυρίων δολαρίων μετά από έναν επιτυχημένο γύρο χρηματοδότησης. Επίσης, πρόσφατα, η SoftBank αύξησε τη συμμετοχή της στην εταιρεία με εξαγορά μετοχών αξίας 1,5 δισεκατομμυρίων δολαρίων.

Παρά τις δυνατότητές του, το QwQ-32B-Preview έχει και περιορισμούς. Σύμφωνα με την Alibaba, εμφανίζει προβλήματα όπως μη αναμενόμενες αλλαγές γλώσσας, κάτι που μπορεί να προκαλέσει σύγχυση στους χρήστες. Επιπλέον, υπολείπεται σε εργασίες που απαιτούν κοινή λογική, ένα κοινό ζήτημα για πολλά συστήματα AI.

Το μοντέλο μπορεί να αντιμετωπίσει λογικούς βρόχους, καθυστερώντας τις αποκρίσεις, αλλά η δυνατότητα να ελέγχει τις απαντήσεις του μειώνει τα σφάλματα, αν και αυξάνει τον χρόνο επεξεργασίας.

Η προσέγγιση της Alibaba να ευθυγραμμίσει το μοντέλο με τα κινεζικά ρυθμιστικά πρότυπα το καθιστά ιδανικό για την εγχώρια αγορά, αλλά μπορεί να περιορίσει την ελκυστικότητά του σε διεθνές επίπεδο. Για παράδειγμα, σε θέματα όπως η Ταϊβάν, οι απαντήσεις του μοντέλου ευθυγραμμίζονται με τη στάση της κινεζικής κυβέρνησης, ενώ ζητήματα όπως η Τιενανμέν δεν λαμβάνουν καμία απόκριση.

Παρά τα όριά του, το QwQ-32B-Preview σηματοδοτεί μια σημαντική πρόοδο στον χώρο της συλλογιστικής AI, δείχνοντας τόσο τις δυνατότητες όσο και τις προκλήσεις της τεχνολογίας.

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
We use cookies to personalise content and ads, to provide social media features and to analyse our traffic. We also share information about your use of our site with our social media, advertising and analytics partners. View more
Cookies settings
Accept
Privacy & Cookie policy
Privacy & Cookies policy
Cookie name Active
Save settings
Cookies settings