Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Firma xAI zaprezentowała dwa nowe modele — Grok 4 oraz Grok 4 Heavy — zaledwie dzień po tym, jak chatbot Grok wygenerował na platformie X odpowiedzi zawierające antysemickie odniesienia. Według xAI wersja Heavy korzysta z architektury multi-agentowej, w której wiele instancji modelu analizuje zapytanie równolegle, a następnie porównuje wyniki przed udzieleniem odpowiedzi. To podejście, określane jako test-time compute scaling, zwiększa wykorzystanie mocy obliczeniowej podczas wnioskowania, – informuje Ars Technica.

Benchmarki, agenci i testy akademickie

W trakcie transmisji Elon Musk poinformował, że nowe modele osiągnęły wyniki na poziomie tzw. frontier AI. W teście Humanity’s Last Exam model Grok 4 uzyskał 25,4% bez użycia narzędzi zewnętrznych, co według xAI przewyższało wyniki modelu OpenAI o3 (21%) i Gemini 2.5 Pro od Google (21,6%). Z kolei Grok 4 Heavy z włączonymi narzędziami osiągnął 44,4%. Organizacja Arc Prize podała również, że Grok 4 Thinking zdobył 15,9% w teście ARC-AGI-2, co niemal podwaja dotychczasowy najlepszy komercyjny wynik. 

 With respect to academic questions, Grok 4 is better than PhD level in every subject, no exceptions.

Stwierdził Musk

Kryzys wizerunkowy po skandalu na X

Wcześniejsze kontrowersje wyniknęły z aktualizacji systemu Grok, która umożliwiała generowanie politycznie niepoprawnych treści, jeśli były „dobrze uargumentowane”. Efektem były m.in. odpowiedzi z hasłem „MechaHitler”, które wywołały reakcje rządowe — Polska zapowiedziała zgłoszenie sprawy do Komisji Europejskiej, a Turcja częściowo zablokowała dostęp do modelu. Musk przyznał, że chatbot był „zbyt uległy wobec użytkowników” i obiecał zmiany w zachowaniu systemu.

Subskrypcje, Tesla i odejście CEO

W tym samym tygodniu xAI ogłosiło plany udostępnienia Grok 4 w samochodach Tesli oraz wprowadzenie kolejnych funkcji: modelu kodującego (sierpień), agenta multimodalnego (wrzesień) i generatora wideo (październik). Jednocześnie firma wprowadziła subskrypcję SuperGrok Heavy za 300 dolarów miesięcznie — najdroższą z dostępnych usług AI. Nowości ogłoszono w dniu rezygnacji CEO X Lindy Yaccarino, która napisała, że „najlepsze dopiero przed nami”, komentując przejęcie X przez xAI w transakcji o wartości 33 miliardów dolarów.

Avatar
Apr 18

OpenAI uruchamia Flex – tańszy tryb API w zamian za wolniejsze działanie

OpenAI zaprezentowało nową opcję korzystania z modeli sztucznej inteligencji, która pozwala obniżyć koszty obsługi zadań asynchronicznych i testowych. Tryb Flex, dostępny w wersji beta, zapewnia niższe opłaty za przetwarzanie, oferując jednak wolniejszy czas odpowiedzi oraz ryzyko czasowej niedostępności zasobów. Rozwiązanie jest skierowane do projektów, które nie wymagają natychmiastowych rezultatów, np. podczas ewaluacji modeli czy wzbogacania zbiorów danych.
0
Apr 21

Sąd uznał Google za winne w części zarzutów związanych z technologiami reklamowymi

Sąd federalny w Stanach Zjednoczonych orzekł, że Google nadużyło pozycji dominującej na rynku technologii reklamowych, łącząc swoje narzędzia dla wydawców w sposób eliminujący konkurencję. To częściowe zwycięstwo amerykańskiego Departamentu Sprawiedliwości (DOJ), który domagał się podziału segmentu reklamowego koncernu.
0
Jun 23

„Eksport ukraińskich technologii obronnych — będzie”: Ukraina uruchomi produkcję uzbrojenia w Europie

Tego lata Ukraina podpisze pierwsze umowy w ramach programu Build with Ukraine — w celu rozpoczęcia eksportu technologii wojskowych i uruchomienia linii produkcyjnych w krajach europejskich. Jak poinformował prezydent Wołodymyr Zełenski w oficjalnym oświadczeniu, na które powołuje się agencja Reuters.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies