Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Firma xAI zaprezentowała dwa nowe modele — Grok 4 oraz Grok 4 Heavy — zaledwie dzień po tym, jak chatbot Grok wygenerował na platformie X odpowiedzi zawierające antysemickie odniesienia. Według xAI wersja Heavy korzysta z architektury multi-agentowej, w której wiele instancji modelu analizuje zapytanie równolegle, a następnie porównuje wyniki przed udzieleniem odpowiedzi. To podejście, określane jako test-time compute scaling, zwiększa wykorzystanie mocy obliczeniowej podczas wnioskowania, – informuje Ars Technica.

Benchmarki, agenci i testy akademickie

W trakcie transmisji Elon Musk poinformował, że nowe modele osiągnęły wyniki na poziomie tzw. frontier AI. W teście Humanity’s Last Exam model Grok 4 uzyskał 25,4% bez użycia narzędzi zewnętrznych, co według xAI przewyższało wyniki modelu OpenAI o3 (21%) i Gemini 2.5 Pro od Google (21,6%). Z kolei Grok 4 Heavy z włączonymi narzędziami osiągnął 44,4%. Organizacja Arc Prize podała również, że Grok 4 Thinking zdobył 15,9% w teście ARC-AGI-2, co niemal podwaja dotychczasowy najlepszy komercyjny wynik. 

 With respect to academic questions, Grok 4 is better than PhD level in every subject, no exceptions.

Stwierdził Musk

Kryzys wizerunkowy po skandalu na X

Wcześniejsze kontrowersje wyniknęły z aktualizacji systemu Grok, która umożliwiała generowanie politycznie niepoprawnych treści, jeśli były „dobrze uargumentowane”. Efektem były m.in. odpowiedzi z hasłem „MechaHitler”, które wywołały reakcje rządowe — Polska zapowiedziała zgłoszenie sprawy do Komisji Europejskiej, a Turcja częściowo zablokowała dostęp do modelu. Musk przyznał, że chatbot był „zbyt uległy wobec użytkowników” i obiecał zmiany w zachowaniu systemu.

Subskrypcje, Tesla i odejście CEO

W tym samym tygodniu xAI ogłosiło plany udostępnienia Grok 4 w samochodach Tesli oraz wprowadzenie kolejnych funkcji: modelu kodującego (sierpień), agenta multimodalnego (wrzesień) i generatora wideo (październik). Jednocześnie firma wprowadziła subskrypcję SuperGrok Heavy za 300 dolarów miesięcznie — najdroższą z dostępnych usług AI. Nowości ogłoszono w dniu rezygnacji CEO X Lindy Yaccarino, która napisała, że „najlepsze dopiero przed nami”, komentując przejęcie X przez xAI w transakcji o wartości 33 miliardów dolarów.

Avatar
Cze 19

16 miliardów wykradzionych haseł. Ujawniono dane z Apple, Google, Facebooka i GitHuba

Eksperci potwierdzili ogromny wyciek danych obejmujący aż 16 miliardów kont użytkowników. Chodzi o loginy, hasła, adresy stron internetowych, a nawet tokeny dostępu. Wśród poszkodowanych są użytkownicy takich usług jak Apple, Facebook, Google, Telegram, GitHub, serwisy VPN, sklepy internetowe, portale dla deweloperów, a także platformy rządowe.
0
Lip 15

UE testuje aplikację do weryfikacji wieku użytkowników online

Komisja Europejska rozpoczęła pilotaż aplikacji do weryfikacji wieku w pięciu krajach: Danii, Grecji, Hiszpanii, Francji i Włoszech. Narzędzie ma pomóc platformom internetowym w skuteczniejszej ochronie małoletnich i spełnianiu wymogów wynikających z Aktu o usługach cyfrowych (DSA), – informuje Komisja Europejska.
0
Sty 8

6 tez Sama Altmana o koszcie ChatGPT, rekrutacji inżynierów i konflikcie z radą dyrektorów OpenAI

Dyrektor generalny OpenAI, Sam Altman, udzielił obszernego wywiadu, w którym wspomniał o konflikcie z zarządem w 2023 roku, opowiedział o swoim harmonogramie pracy, opcjach cenowych ChatGPT oraz o tym, jak firmie udało się przyciągnąć najbardziej utalentowanych inżynierów. Oto najważniejsze tezy z artykułu Bloomberga.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies