Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Firma xAI zaprezentowała dwa nowe modele — Grok 4 oraz Grok 4 Heavy — zaledwie dzień po tym, jak chatbot Grok wygenerował na platformie X odpowiedzi zawierające antysemickie odniesienia. Według xAI wersja Heavy korzysta z architektury multi-agentowej, w której wiele instancji modelu analizuje zapytanie równolegle, a następnie porównuje wyniki przed udzieleniem odpowiedzi. To podejście, określane jako test-time compute scaling, zwiększa wykorzystanie mocy obliczeniowej podczas wnioskowania, – informuje Ars Technica.

Benchmarki, agenci i testy akademickie

W trakcie transmisji Elon Musk poinformował, że nowe modele osiągnęły wyniki na poziomie tzw. frontier AI. W teście Humanity’s Last Exam model Grok 4 uzyskał 25,4% bez użycia narzędzi zewnętrznych, co według xAI przewyższało wyniki modelu OpenAI o3 (21%) i Gemini 2.5 Pro od Google (21,6%). Z kolei Grok 4 Heavy z włączonymi narzędziami osiągnął 44,4%. Organizacja Arc Prize podała również, że Grok 4 Thinking zdobył 15,9% w teście ARC-AGI-2, co niemal podwaja dotychczasowy najlepszy komercyjny wynik. 

 With respect to academic questions, Grok 4 is better than PhD level in every subject, no exceptions.

Stwierdził Musk

Kryzys wizerunkowy po skandalu na X

Wcześniejsze kontrowersje wyniknęły z aktualizacji systemu Grok, która umożliwiała generowanie politycznie niepoprawnych treści, jeśli były „dobrze uargumentowane”. Efektem były m.in. odpowiedzi z hasłem „MechaHitler”, które wywołały reakcje rządowe — Polska zapowiedziała zgłoszenie sprawy do Komisji Europejskiej, a Turcja częściowo zablokowała dostęp do modelu. Musk przyznał, że chatbot był „zbyt uległy wobec użytkowników” i obiecał zmiany w zachowaniu systemu.

Subskrypcje, Tesla i odejście CEO

W tym samym tygodniu xAI ogłosiło plany udostępnienia Grok 4 w samochodach Tesli oraz wprowadzenie kolejnych funkcji: modelu kodującego (sierpień), agenta multimodalnego (wrzesień) i generatora wideo (październik). Jednocześnie firma wprowadziła subskrypcję SuperGrok Heavy za 300 dolarów miesięcznie — najdroższą z dostępnych usług AI. Nowości ogłoszono w dniu rezygnacji CEO X Lindy Yaccarino, która napisała, że „najlepsze dopiero przed nami”, komentując przejęcie X przez xAI w transakcji o wartości 33 miliardów dolarów.

Avatar
Mar 30, 2025

Pierwsza próba orbitalnego startu z terytorium Europy zakończyła się niepowodzeniem

Lekka rakieta nośna Spectrum, opracowana przez niemiecką firmę Isar Aerospace, uległa awarii po starcie z norweskiego kosmodromu Andøya.
0
Jun 5, 2025

Sąd apelacyjny odrzuca wniosek Apple — zmiany w App Store pozostają w mocy

Amerykański Sąd Apelacyjny dla Dziewiątego Okręgu odrzucił wniosek Apple o tymczasowe wstrzymanie decyzji sądu niższej instancji, która nakłada na firmę obowiązek umożliwienia deweloperom kierowania użytkowników do zewnętrznych systemów płatności bez pobierania prowizji. Spółka nie wykazała, że spełnione zostały warunki konieczne do zawieszenia wykonania wyroku,
0
Aug 26

Google wprowadza obowiązkową weryfikację deweloperów aplikacji na Androida od 2026 roku

Od 2026 roku instalacja aplikacji na certyfikowanych urządzeniach z Androidem będzie możliwa wyłącznie wtedy, gdy ich twórcy przejdą oficjalną weryfikację dewelopera. Zmiana obejmie nie tylko aplikacje pobierane z Google Play, ale także wszystkie programy instalowane z plików APK, tzw. sideloading.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies