[NEW] Search for a job anonymously — check the details
Close
GPT-5 udostępniony wszystkim użytkownikom ChatGPT

GPT-5 udostępniony wszystkim użytkownikom ChatGPT

OpenAI wprowadził GPT-5, nowy flagowy model dostępny dla wszystkich użytkowników ChatGPT oraz programistów korzystających z API. Model osiąga rekordowe wyniki w wielu obszarach: 94,6% w AIME 25 (matematyka bez narzędzi), 74,9% w SWE-bench Verified (inżynieria oprogramowania) oraz 46,2% w HealthBench (realistyczne rozmowy medyczne). GPT-5 łączy szybką inferencję z rozszerzonym rozumowaniem, uruchamianym automatycznie w przypadku bardziej złożonych zapytań lub po wydaniu komendy w rodzaju „think hard about this”. Wersja GPT-5 pro oferuje jeszcze dłuższe wnioskowanie i wyższą dokładność w zadaniach o dużej złożoności.

Zunifikowana architektura i warianty dostępu

GPT-5 działa jako jeden system z inteligentnym routerem w czasie rzeczywistym, który wybiera między trybem podstawowym a „GPT-5 thinking” na podstawie rodzaju konwersacji, poziomu złożoności i użycia narzędzi. Przykładowo, prośba o analizę złożonego kodu lub zapytanie matematyczne z wieloma krokami automatycznie aktywuje tryb rozszerzonego rozumowania. Po osiągnięciu limitu zapytań w danym planie użytkownik przełącza się na wersję mini, zoptymalizowaną pod kątem szybkości przy zachowaniu wysokiej jakości. GPT-5 jest dostępny we wszystkich planach (Free, Plus, Pro, Team, Enterprise, Edu), z różnymi progami limitów — od ograniczonego dostępu w planie darmowym po nielimitowany w Pro, wraz z dostępem do GPT-5 pro.

Ulepszenia w kodowaniu, pisaniu i odpowiedziach medycznych

W obszarze programowania GPT-5 przewyższa wszystkie wcześniejsze modele w testach SWE-bench Verified (74,9% vs 52,8% dla OpenAI o3) i Aider Polyglot (88% vs 79,6%), radząc sobie z generowaniem kompletnych aplikacji czy gier w jednym pliku HTML. Może np. stworzyć w jednej odpowiedzi kolorową grę 2D z parallax scrolling, śledzeniem wyniku i obsługą dźwięków, dbając przy tym o estetykę interfejsu. W zakresie pisania GPT-5 lepiej utrzymuje formę i rytm tekstu, potrafiąc tworzyć poezję z rozbudowaną metaforyką („czarne flagi kraju, który już nie istnieje”) czy strukturalnie złożone raporty. W zastosowaniach zdrowotnych model uzyskał wynik 46,2% w HealthBench i 3,6% w HealthBench Hard, adaptując odpowiedzi do kontekstu, wiedzy i geolokalizacji użytkownika. Potrafi proaktywnie wskazywać kwestie do omówienia z lekarzem, zachowując bezpieczeństwo informacji.

Bezpieczeństwo, personalizacja i mniejsze ryzyko halucynacji

GPT-5 redukuje odsetek odpowiedzi zawierających błędy faktograficzne o ~45% w porównaniu z GPT-4o i o ~80% względem OpenAI o3 w trybie rozumowania. Mechanizm „safe completions” pozwala częściowo odpowiadać na pytania, w których pełna informacja mogłaby zostać wykorzystana w sposób szkodliwy — np. w biologii model poda wyłącznie ogólne informacje, bez szczegółów umożliwiających odtworzenie niebezpiecznych procesów. Model lepiej rozpoznaje własne ograniczenia — w testach na brakujących multimodalnych danych zredukował wskaźnik nieprawdziwych zapewnień z 86,7% (OpenAI o3) do 9%. W ChatGPT wprowadzono też cztery style osobowości (Cynic, Robot, Listener, Nerd), oparte na poprawionej sterowalności (steerability) modelu, oraz dodatkowe zabezpieczenia w obszarze biologii i chemii zgodne z ramami Preparedness Framework.

Avatar
May 5

Windsurf: według Mohana, nawet przy 90% kodu generowanego przez AI rola programistów pozostaje kluczowa

Varun Mohan, założyciel startupu Windsurf (obecnie rozważanego do przejęcia przez OpenAI), podkreśla, że rozwój AI nie eliminuje znaczenia zespołów inżynierskich. Jego zdaniem technologia skraca czas potrzebny na programowanie, ale nie zastępuje pełnego procesu tworzenia oprogramowania.
0
Jul 18

Anthropic ogranicza dostęp do Claude Code bez wcześniejszego uprzedzenia

Użytkownicy Claude Code – w tym ci na planie Max za 200 dolarów miesięcznie – od poniedziałkowego poranka doświadczają nieoczekiwanych ograniczeń w korzystaniu z usługi. Na ekranie pojawia się jedynie komunikat „Claude usage limit reached” z informacją, kiedy dostęp zostanie przywrócony.
0
Mar 4

Super Mario Bros. jako nowy benchmark dla AI – które modele radzą sobie najlepiej?

Wydawało się, że Pokémon jest trudnym testem dla AI, ale badacze twierdzą, że Super Mario Bros. stanowi jeszcze większe wyzwanie. Hao AI Lab, jednostka badawcza Uniwersytetu Kalifornijskiego w San Diego, przeprowadziła eksperyment, w którym różne modele AI próbowały pokonać kultową grę Nintendo z 1985 roku.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies