GPT-5 udostępniony wszystkim użytkownikom ChatGPT

GPT-5 udostępniony wszystkim użytkownikom ChatGPT

OpenAI wprowadził GPT-5, nowy flagowy model dostępny dla wszystkich użytkowników ChatGPT oraz programistów korzystających z API. Model osiąga rekordowe wyniki w wielu obszarach: 94,6% w AIME 25 (matematyka bez narzędzi), 74,9% w SWE-bench Verified (inżynieria oprogramowania) oraz 46,2% w HealthBench (realistyczne rozmowy medyczne). GPT-5 łączy szybką inferencję z rozszerzonym rozumowaniem, uruchamianym automatycznie w przypadku bardziej złożonych zapytań lub po wydaniu komendy w rodzaju „think hard about this”. Wersja GPT-5 pro oferuje jeszcze dłuższe wnioskowanie i wyższą dokładność w zadaniach o dużej złożoności.

Zunifikowana architektura i warianty dostępu

GPT-5 działa jako jeden system z inteligentnym routerem w czasie rzeczywistym, który wybiera między trybem podstawowym a „GPT-5 thinking” na podstawie rodzaju konwersacji, poziomu złożoności i użycia narzędzi. Przykładowo, prośba o analizę złożonego kodu lub zapytanie matematyczne z wieloma krokami automatycznie aktywuje tryb rozszerzonego rozumowania. Po osiągnięciu limitu zapytań w danym planie użytkownik przełącza się na wersję mini, zoptymalizowaną pod kątem szybkości przy zachowaniu wysokiej jakości. GPT-5 jest dostępny we wszystkich planach (Free, Plus, Pro, Team, Enterprise, Edu), z różnymi progami limitów — od ograniczonego dostępu w planie darmowym po nielimitowany w Pro, wraz z dostępem do GPT-5 pro.

Ulepszenia w kodowaniu, pisaniu i odpowiedziach medycznych

W obszarze programowania GPT-5 przewyższa wszystkie wcześniejsze modele w testach SWE-bench Verified (74,9% vs 52,8% dla OpenAI o3) i Aider Polyglot (88% vs 79,6%), radząc sobie z generowaniem kompletnych aplikacji czy gier w jednym pliku HTML. Może np. stworzyć w jednej odpowiedzi kolorową grę 2D z parallax scrolling, śledzeniem wyniku i obsługą dźwięków, dbając przy tym o estetykę interfejsu. W zakresie pisania GPT-5 lepiej utrzymuje formę i rytm tekstu, potrafiąc tworzyć poezję z rozbudowaną metaforyką („czarne flagi kraju, który już nie istnieje”) czy strukturalnie złożone raporty. W zastosowaniach zdrowotnych model uzyskał wynik 46,2% w HealthBench i 3,6% w HealthBench Hard, adaptując odpowiedzi do kontekstu, wiedzy i geolokalizacji użytkownika. Potrafi proaktywnie wskazywać kwestie do omówienia z lekarzem, zachowując bezpieczeństwo informacji.

Bezpieczeństwo, personalizacja i mniejsze ryzyko halucynacji

GPT-5 redukuje odsetek odpowiedzi zawierających błędy faktograficzne o ~45% w porównaniu z GPT-4o i o ~80% względem OpenAI o3 w trybie rozumowania. Mechanizm „safe completions” pozwala częściowo odpowiadać na pytania, w których pełna informacja mogłaby zostać wykorzystana w sposób szkodliwy — np. w biologii model poda wyłącznie ogólne informacje, bez szczegółów umożliwiających odtworzenie niebezpiecznych procesów. Model lepiej rozpoznaje własne ograniczenia — w testach na brakujących multimodalnych danych zredukował wskaźnik nieprawdziwych zapewnień z 86,7% (OpenAI o3) do 9%. W ChatGPT wprowadzono też cztery style osobowości (Cynic, Robot, Listener, Nerd), oparte na poprawionej sterowalności (steerability) modelu, oraz dodatkowe zabezpieczenia w obszarze biologii i chemii zgodne z ramami Preparedness Framework.

Avatar
Cze 24

Iran publikuje fałszywe nagrania zestrzeleń izraelskich myśliwców, wykorzystując ujęcia z Arma 3 i innej gry

Od 13 czerwca na Bliskim Wschodzie trwa wojna między Izraelem a Iranem. Po tym, jak państwo żydowskie przeprowadziło serię skutecznych ataków, rząd ajatollahów zaczął odpowiadać atakami rakietowymi. Gry komputerowe stały się jednym z narzędzi propagandy w tym konflikcie. Irańskie wojsko wykorzystało ujęcia z Arma 3 oraz rosyjskiej gry War Thunder, aby zaprezentować sfabrykowane zestrzelenia izraelskich samolotów. Nagrania te były intensywnie rozpowszechniane w mediach społecznościowych.
0
Maj 15

Amazon redukuje zatrudnienie w działach Alexa, Echo i Kuiper. Zwolnienia objęły 100 osób

Amazon potwierdził 14 maja redukcję ok. 100 etatów w dziale Devices & Services, odpowiedzialnym m.in. za rozwój Alexy, inteligentnych głośników Echo, samochodów autonomicznych Zoox oraz satelitarnego projektu Kuiper. To kolejna fala zwolnień w tym obszarze — wcześniejsze cięcia miały miejsce w 2022 i 2023 roku. Informuje serwis CNBC.
0
Maj 13

USA i Chiny obniżają wzajemne taryfy na 90 dni. Celem jest złagodzenie napięć handlowych

12 maja w Genewie USA i Chiny ogłosiły porozumienie o czasowym zmniejszeniu wzajemnych ceł, które obowiązuje od 14 maja. Według Bloomberga, celem trzymiesięcznego rozejmu jest kontynuacja rozmów i znalezienie rozwiązania dla sporów handlowych między dwoma największymi gospodarkami świata.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies