[NEW] Szukaj pracy anonimowo — sprawdź szczegóły
Close
GPT-5 udostępniony wszystkim użytkownikom ChatGPT

GPT-5 udostępniony wszystkim użytkownikom ChatGPT

OpenAI wprowadził GPT-5, nowy flagowy model dostępny dla wszystkich użytkowników ChatGPT oraz programistów korzystających z API. Model osiąga rekordowe wyniki w wielu obszarach: 94,6% w AIME 25 (matematyka bez narzędzi), 74,9% w SWE-bench Verified (inżynieria oprogramowania) oraz 46,2% w HealthBench (realistyczne rozmowy medyczne). GPT-5 łączy szybką inferencję z rozszerzonym rozumowaniem, uruchamianym automatycznie w przypadku bardziej złożonych zapytań lub po wydaniu komendy w rodzaju „think hard about this”. Wersja GPT-5 pro oferuje jeszcze dłuższe wnioskowanie i wyższą dokładność w zadaniach o dużej złożoności.

Zunifikowana architektura i warianty dostępu

GPT-5 działa jako jeden system z inteligentnym routerem w czasie rzeczywistym, który wybiera między trybem podstawowym a „GPT-5 thinking” na podstawie rodzaju konwersacji, poziomu złożoności i użycia narzędzi. Przykładowo, prośba o analizę złożonego kodu lub zapytanie matematyczne z wieloma krokami automatycznie aktywuje tryb rozszerzonego rozumowania. Po osiągnięciu limitu zapytań w danym planie użytkownik przełącza się na wersję mini, zoptymalizowaną pod kątem szybkości przy zachowaniu wysokiej jakości. GPT-5 jest dostępny we wszystkich planach (Free, Plus, Pro, Team, Enterprise, Edu), z różnymi progami limitów — od ograniczonego dostępu w planie darmowym po nielimitowany w Pro, wraz z dostępem do GPT-5 pro.

Ulepszenia w kodowaniu, pisaniu i odpowiedziach medycznych

W obszarze programowania GPT-5 przewyższa wszystkie wcześniejsze modele w testach SWE-bench Verified (74,9% vs 52,8% dla OpenAI o3) i Aider Polyglot (88% vs 79,6%), radząc sobie z generowaniem kompletnych aplikacji czy gier w jednym pliku HTML. Może np. stworzyć w jednej odpowiedzi kolorową grę 2D z parallax scrolling, śledzeniem wyniku i obsługą dźwięków, dbając przy tym o estetykę interfejsu. W zakresie pisania GPT-5 lepiej utrzymuje formę i rytm tekstu, potrafiąc tworzyć poezję z rozbudowaną metaforyką („czarne flagi kraju, który już nie istnieje”) czy strukturalnie złożone raporty. W zastosowaniach zdrowotnych model uzyskał wynik 46,2% w HealthBench i 3,6% w HealthBench Hard, adaptując odpowiedzi do kontekstu, wiedzy i geolokalizacji użytkownika. Potrafi proaktywnie wskazywać kwestie do omówienia z lekarzem, zachowując bezpieczeństwo informacji.

Bezpieczeństwo, personalizacja i mniejsze ryzyko halucynacji

GPT-5 redukuje odsetek odpowiedzi zawierających błędy faktograficzne o ~45% w porównaniu z GPT-4o i o ~80% względem OpenAI o3 w trybie rozumowania. Mechanizm „safe completions” pozwala częściowo odpowiadać na pytania, w których pełna informacja mogłaby zostać wykorzystana w sposób szkodliwy — np. w biologii model poda wyłącznie ogólne informacje, bez szczegółów umożliwiających odtworzenie niebezpiecznych procesów. Model lepiej rozpoznaje własne ograniczenia — w testach na brakujących multimodalnych danych zredukował wskaźnik nieprawdziwych zapewnień z 86,7% (OpenAI o3) do 9%. W ChatGPT wprowadzono też cztery style osobowości (Cynic, Robot, Listener, Nerd), oparte na poprawionej sterowalności (steerability) modelu, oraz dodatkowe zabezpieczenia w obszarze biologii i chemii zgodne z ramami Preparedness Framework.

Avatar
Lut 20

Linus Torvalds planuje wprowadzić zmiany związane z Rust z pominięciem maintainerów jądra Linux

Christoph Hellwig, maintainer podsystemów DMA, KVM, Slab Allocator oraz architektury PowerPC w jądrze Linux, zdecydowanie sprzeciwił się przyjęciu Rust-owego wsparcia dla podsystemu DMA, twierdząc, że takie zmiany nie mają sensu, dopóki nie zostaną uzgodnione ze społecznością i uwzględnione w dokumentacji jądra.
0
Maj 27

WhatsApp Web zyska nowy scentralizowany panel multimediów

Meta pracuje nad funkcją, która umożliwi użytkownikom WhatsApp Web przeglądanie i zarządzanie wszystkimi przesłanymi plikami multimedialnymi w jednym miejscu, bez potrzeby przeszukiwania pojedynczych rozmów, – informuje WABetaInfo.
0
Lip 10

Nvidia wyprzedza Apple i Microsoft. Kapitalizacja spółki przekracza 4 biliony dolarów

Nvidia wyprzedziła Apple i Microsoft pod względem wartości rynkowej, osiągając poziom 4 bilionów dolarów. To najwyższa kapitalizacja giełdowa w historii spółek technologicznych, napędzana globalnym popytem na chipy do sztucznej inteligencji i rekordowym kursem akcji, który 9 lipca sięgnął 164 dolarów
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies