Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Firma xAI zaprezentowała dwa nowe modele — Grok 4 oraz Grok 4 Heavy — zaledwie dzień po tym, jak chatbot Grok wygenerował na platformie X odpowiedzi zawierające antysemickie odniesienia. Według xAI wersja Heavy korzysta z architektury multi-agentowej, w której wiele instancji modelu analizuje zapytanie równolegle, a następnie porównuje wyniki przed udzieleniem odpowiedzi. To podejście, określane jako test-time compute scaling, zwiększa wykorzystanie mocy obliczeniowej podczas wnioskowania, – informuje Ars Technica.

Benchmarki, agenci i testy akademickie

W trakcie transmisji Elon Musk poinformował, że nowe modele osiągnęły wyniki na poziomie tzw. frontier AI. W teście Humanity’s Last Exam model Grok 4 uzyskał 25,4% bez użycia narzędzi zewnętrznych, co według xAI przewyższało wyniki modelu OpenAI o3 (21%) i Gemini 2.5 Pro od Google (21,6%). Z kolei Grok 4 Heavy z włączonymi narzędziami osiągnął 44,4%. Organizacja Arc Prize podała również, że Grok 4 Thinking zdobył 15,9% w teście ARC-AGI-2, co niemal podwaja dotychczasowy najlepszy komercyjny wynik. 

 With respect to academic questions, Grok 4 is better than PhD level in every subject, no exceptions.

Stwierdził Musk

Kryzys wizerunkowy po skandalu na X

Wcześniejsze kontrowersje wyniknęły z aktualizacji systemu Grok, która umożliwiała generowanie politycznie niepoprawnych treści, jeśli były „dobrze uargumentowane”. Efektem były m.in. odpowiedzi z hasłem „MechaHitler”, które wywołały reakcje rządowe — Polska zapowiedziała zgłoszenie sprawy do Komisji Europejskiej, a Turcja częściowo zablokowała dostęp do modelu. Musk przyznał, że chatbot był „zbyt uległy wobec użytkowników” i obiecał zmiany w zachowaniu systemu.

Subskrypcje, Tesla i odejście CEO

W tym samym tygodniu xAI ogłosiło plany udostępnienia Grok 4 w samochodach Tesli oraz wprowadzenie kolejnych funkcji: modelu kodującego (sierpień), agenta multimodalnego (wrzesień) i generatora wideo (październik). Jednocześnie firma wprowadziła subskrypcję SuperGrok Heavy za 300 dolarów miesięcznie — najdroższą z dostępnych usług AI. Nowości ogłoszono w dniu rezygnacji CEO X Lindy Yaccarino, która napisała, że „najlepsze dopiero przed nami”, komentując przejęcie X przez xAI w transakcji o wartości 33 miliardów dolarów.

Avatar
Mar 28

Revolut uruchamia aplikację mobilną dla swojej giełdy kryptowalut

Revolut wydał aplikację mobilną dla swojej giełdy Revolut X, którą początkowo uruchomił w maju 2024 roku z myślą o profesjonalnych inwestorach. Nowa aplikacja jest dostępna dla użytkowników z Wielkiej Brytanii oraz Europejskiego Obszaru Gospodarczego (EOG), co oznacza otwarcie platformy również dla klientów detalicznych.
0
Feb 3, 2025

SoftBank i OpenAI tworzą wspólne przedsiębiorstwo na rzecz rozwoju AI

Japoński gigant technologiczny SoftBank Group oraz OpenAI ogłosili utworzenie wspólnego przedsiębiorstwa SB OpenAI Japan, którego udziały zostaną podzielone po równo między obie firmy. Informację tę przekazali dyrektorzy obu spółek – Masayoshi Son oraz Sam Altman – podczas wydarzenia w Tokio, zachęcając japońskie firmy do współpracy.
0
Apr 22

Departament Sprawiedliwości USA domaga się sprzedaży przeglądarki Chrome przez Google

Departament Sprawiedliwości Stanów Zjednoczonych rozpoczął kolejną fazę jednego z najgłośniejszych postępowań antymonopolowych ostatnich lat. Celem jest ograniczenie wpływu Google na rynek wyszukiwarek internetowych oraz zbadanie roli, jaką w tym procesie odgrywają technologie sztucznej inteligencji.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies