Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Firma xAI zaprezentowała dwa nowe modele — Grok 4 oraz Grok 4 Heavy — zaledwie dzień po tym, jak chatbot Grok wygenerował na platformie X odpowiedzi zawierające antysemickie odniesienia. Według xAI wersja Heavy korzysta z architektury multi-agentowej, w której wiele instancji modelu analizuje zapytanie równolegle, a następnie porównuje wyniki przed udzieleniem odpowiedzi. To podejście, określane jako test-time compute scaling, zwiększa wykorzystanie mocy obliczeniowej podczas wnioskowania, – informuje Ars Technica.

Benchmarki, agenci i testy akademickie

W trakcie transmisji Elon Musk poinformował, że nowe modele osiągnęły wyniki na poziomie tzw. frontier AI. W teście Humanity’s Last Exam model Grok 4 uzyskał 25,4% bez użycia narzędzi zewnętrznych, co według xAI przewyższało wyniki modelu OpenAI o3 (21%) i Gemini 2.5 Pro od Google (21,6%). Z kolei Grok 4 Heavy z włączonymi narzędziami osiągnął 44,4%. Organizacja Arc Prize podała również, że Grok 4 Thinking zdobył 15,9% w teście ARC-AGI-2, co niemal podwaja dotychczasowy najlepszy komercyjny wynik. 

 With respect to academic questions, Grok 4 is better than PhD level in every subject, no exceptions.

Stwierdził Musk

Kryzys wizerunkowy po skandalu na X

Wcześniejsze kontrowersje wyniknęły z aktualizacji systemu Grok, która umożliwiała generowanie politycznie niepoprawnych treści, jeśli były „dobrze uargumentowane”. Efektem były m.in. odpowiedzi z hasłem „MechaHitler”, które wywołały reakcje rządowe — Polska zapowiedziała zgłoszenie sprawy do Komisji Europejskiej, a Turcja częściowo zablokowała dostęp do modelu. Musk przyznał, że chatbot był „zbyt uległy wobec użytkowników” i obiecał zmiany w zachowaniu systemu.

Subskrypcje, Tesla i odejście CEO

W tym samym tygodniu xAI ogłosiło plany udostępnienia Grok 4 w samochodach Tesli oraz wprowadzenie kolejnych funkcji: modelu kodującego (sierpień), agenta multimodalnego (wrzesień) i generatora wideo (październik). Jednocześnie firma wprowadziła subskrypcję SuperGrok Heavy za 300 dolarów miesięcznie — najdroższą z dostępnych usług AI. Nowości ogłoszono w dniu rezygnacji CEO X Lindy Yaccarino, która napisała, że „najlepsze dopiero przed nami”, komentując przejęcie X przez xAI w transakcji o wartości 33 miliardów dolarów.

Avatar
Mar 20, 2023

Zbiorowa petycja pracowników Google ws. lepszego traktowania przy zwolnieniach grupowych

Prawie 1400 pracowników firmy macierzystej Google Alphabet Inc. podpisało petycję wzywającą do lepszego traktowania pracowników podczas procesu zwolnień grupowych.
0
Feb 14, 2025

Praktyczne komputery kwantowe za 5-10 lat? Sundar Pichai o przełomie i obawach rynku

Podczas World Government Summit w Dubaju dyrektor generalny Google, Sundar Pichai, zapowiedział, że pierwsze praktycznie użyteczne komputery kwantowe mogą pojawić się w ciągu 5-10 lat. Pichai porównał obecną fazę rozwoju obliczeń kwantowych do początków prac nad sztuczną inteligencją w Google w latach 2010, gdy firma rozwijała projekt Google Brain. Jego zdaniem, właśnie teraz branża kwantowa zaczyna wychodzić poza etap eksperymentów.
0
Jul 15

Google połączy Androida i ChromeOS w jedną platformę

Google planuje zintegrować swoje dwa systemy operacyjne – Androida i ChromeOS – w jedną wspólną platformę. Poinformował o tym Sameer Samat, prezes ekosystemu Androida, w rozmowie z TechRadar. To pierwsze oficjalne potwierdzenie planów, o których spekulowano już od miesięcy
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies