GPT-5 udostępniony wszystkim użytkownikom ChatGPT

GPT-5 udostępniony wszystkim użytkownikom ChatGPT

OpenAI wprowadził GPT-5, nowy flagowy model dostępny dla wszystkich użytkowników ChatGPT oraz programistów korzystających z API. Model osiąga rekordowe wyniki w wielu obszarach: 94,6% w AIME 25 (matematyka bez narzędzi), 74,9% w SWE-bench Verified (inżynieria oprogramowania) oraz 46,2% w HealthBench (realistyczne rozmowy medyczne). GPT-5 łączy szybką inferencję z rozszerzonym rozumowaniem, uruchamianym automatycznie w przypadku bardziej złożonych zapytań lub po wydaniu komendy w rodzaju „think hard about this”. Wersja GPT-5 pro oferuje jeszcze dłuższe wnioskowanie i wyższą dokładność w zadaniach o dużej złożoności.

Zunifikowana architektura i warianty dostępu

GPT-5 działa jako jeden system z inteligentnym routerem w czasie rzeczywistym, który wybiera między trybem podstawowym a „GPT-5 thinking” na podstawie rodzaju konwersacji, poziomu złożoności i użycia narzędzi. Przykładowo, prośba o analizę złożonego kodu lub zapytanie matematyczne z wieloma krokami automatycznie aktywuje tryb rozszerzonego rozumowania. Po osiągnięciu limitu zapytań w danym planie użytkownik przełącza się na wersję mini, zoptymalizowaną pod kątem szybkości przy zachowaniu wysokiej jakości. GPT-5 jest dostępny we wszystkich planach (Free, Plus, Pro, Team, Enterprise, Edu), z różnymi progami limitów — od ograniczonego dostępu w planie darmowym po nielimitowany w Pro, wraz z dostępem do GPT-5 pro.

Ulepszenia w kodowaniu, pisaniu i odpowiedziach medycznych

W obszarze programowania GPT-5 przewyższa wszystkie wcześniejsze modele w testach SWE-bench Verified (74,9% vs 52,8% dla OpenAI o3) i Aider Polyglot (88% vs 79,6%), radząc sobie z generowaniem kompletnych aplikacji czy gier w jednym pliku HTML. Może np. stworzyć w jednej odpowiedzi kolorową grę 2D z parallax scrolling, śledzeniem wyniku i obsługą dźwięków, dbając przy tym o estetykę interfejsu. W zakresie pisania GPT-5 lepiej utrzymuje formę i rytm tekstu, potrafiąc tworzyć poezję z rozbudowaną metaforyką („czarne flagi kraju, który już nie istnieje”) czy strukturalnie złożone raporty. W zastosowaniach zdrowotnych model uzyskał wynik 46,2% w HealthBench i 3,6% w HealthBench Hard, adaptując odpowiedzi do kontekstu, wiedzy i geolokalizacji użytkownika. Potrafi proaktywnie wskazywać kwestie do omówienia z lekarzem, zachowując bezpieczeństwo informacji.

Bezpieczeństwo, personalizacja i mniejsze ryzyko halucynacji

GPT-5 redukuje odsetek odpowiedzi zawierających błędy faktograficzne o ~45% w porównaniu z GPT-4o i o ~80% względem OpenAI o3 w trybie rozumowania. Mechanizm „safe completions” pozwala częściowo odpowiadać na pytania, w których pełna informacja mogłaby zostać wykorzystana w sposób szkodliwy — np. w biologii model poda wyłącznie ogólne informacje, bez szczegółów umożliwiających odtworzenie niebezpiecznych procesów. Model lepiej rozpoznaje własne ograniczenia — w testach na brakujących multimodalnych danych zredukował wskaźnik nieprawdziwych zapewnień z 86,7% (OpenAI o3) do 9%. W ChatGPT wprowadzono też cztery style osobowości (Cynic, Robot, Listener, Nerd), oparte na poprawionej sterowalności (steerability) modelu, oraz dodatkowe zabezpieczenia w obszarze biologii i chemii zgodne z ramami Preparedness Framework.

Avatar
Jan 30, 2025

Nassim Taleb: wyprzedaż akcji NVIDIA to początek spadków na rynku AI

Autor książki Czarny Łabędź, Nassim Taleb, ostrzega, że poniedziałkowa wyprzedaż akcji NVIDIA z 27 stycznia to jedynie wstęp do większych turbulencji na rynku firm rozwijających sztuczną inteligencję. W rozmowie z Bloomberg News podkreślił, że inwestorzy dopiero zaczynają dostrzegać rzeczywiste ryzyka.
0
Aug 10, 2023

Kevuru Games otworzyło biuro w Warszawie

Warszawskie biuro Kevuru Games ma na celu rozszerzenie obecności na globalnym rynku tworzenia gier, stworzenie centrum sprzedaży dla europejskich klientów oraz miejsca pracy dla pracowników za granicą.
0
Jan 31, 2025

OpenAI oskarża chińską firmę DeepSeek o nielegalne wykorzystywanie jej modeli AI

Firma OpenAI, twórca ChatGPT, poinformowała, że posiada dowody na wykorzystanie jej modeli AI przez chińskie laboratorium DeepSeek do trenowania własnego systemu sztucznej inteligencji. Według Financial Times, OpenAI uważa, że działanie to narusza warunki korzystania z ChatGPT.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies