MindTheChart.io
Blocco Tasto Destro e Protezione Immagini Blocco Tasto Destro e Protezione Immagini

🔵"Controversia tra OpenAI e xAI: Accuse di misleading nei benchmark di Grok3"

🔵"Controversia tra OpenAI e xAI: Accuse di misleading nei benchmark di Grok3"

Giorno: 2025-02-23 | Ora: 07:37:07 Recenti notizie riportano che un dipendente di OpenAI ha accusato xAI, l'azienda di Elon Musk, di presentare in modo fuorviante i risultati dei test di benchmark del suo ultimo modello AI, Grok3. Igor Babushkin, cofondatore di xAI, ha difeso la compagnia, affermando che non ci sono stati comportamenti scorretti. I grafici di xAI mostrano che due versioni di Grok3, il Grok3 Reasoning Beta e il Grok3 mini Reasoning, hanno superato le prestazioni dell'attuale modello più potente di OpenAI, l'o3-mini-high, nel benchmark AIME 2025. Tuttavia, un dipendente di OpenAI ha prontamente sottolineato che i grafici di xAI non riportavano il punteggio dell'o3-mini-high sotto la condizione "cons@64". Babushkin ha risposto su X, sostenendo che anche OpenAI ha usato grafici di benchmark simili in passato per comparare le prestazioni dei propri modelli. https://www.panewslab.com/zh/sqarticledetails/wdeez9vn.html