GPT-5 udostępniony wszystkim użytkownikom ChatGPT

GPT-5 udostępniony wszystkim użytkownikom ChatGPT

OpenAI wprowadził GPT-5, nowy flagowy model dostępny dla wszystkich użytkowników ChatGPT oraz programistów korzystających z API. Model osiąga rekordowe wyniki w wielu obszarach: 94,6% w AIME 25 (matematyka bez narzędzi), 74,9% w SWE-bench Verified (inżynieria oprogramowania) oraz 46,2% w HealthBench (realistyczne rozmowy medyczne). GPT-5 łączy szybką inferencję z rozszerzonym rozumowaniem, uruchamianym automatycznie w przypadku bardziej złożonych zapytań lub po wydaniu komendy w rodzaju „think hard about this”. Wersja GPT-5 pro oferuje jeszcze dłuższe wnioskowanie i wyższą dokładność w zadaniach o dużej złożoności.

Zunifikowana architektura i warianty dostępu

GPT-5 działa jako jeden system z inteligentnym routerem w czasie rzeczywistym, który wybiera między trybem podstawowym a „GPT-5 thinking” na podstawie rodzaju konwersacji, poziomu złożoności i użycia narzędzi. Przykładowo, prośba o analizę złożonego kodu lub zapytanie matematyczne z wieloma krokami automatycznie aktywuje tryb rozszerzonego rozumowania. Po osiągnięciu limitu zapytań w danym planie użytkownik przełącza się na wersję mini, zoptymalizowaną pod kątem szybkości przy zachowaniu wysokiej jakości. GPT-5 jest dostępny we wszystkich planach (Free, Plus, Pro, Team, Enterprise, Edu), z różnymi progami limitów — od ograniczonego dostępu w planie darmowym po nielimitowany w Pro, wraz z dostępem do GPT-5 pro.

Ulepszenia w kodowaniu, pisaniu i odpowiedziach medycznych

W obszarze programowania GPT-5 przewyższa wszystkie wcześniejsze modele w testach SWE-bench Verified (74,9% vs 52,8% dla OpenAI o3) i Aider Polyglot (88% vs 79,6%), radząc sobie z generowaniem kompletnych aplikacji czy gier w jednym pliku HTML. Może np. stworzyć w jednej odpowiedzi kolorową grę 2D z parallax scrolling, śledzeniem wyniku i obsługą dźwięków, dbając przy tym o estetykę interfejsu. W zakresie pisania GPT-5 lepiej utrzymuje formę i rytm tekstu, potrafiąc tworzyć poezję z rozbudowaną metaforyką („czarne flagi kraju, który już nie istnieje”) czy strukturalnie złożone raporty. W zastosowaniach zdrowotnych model uzyskał wynik 46,2% w HealthBench i 3,6% w HealthBench Hard, adaptując odpowiedzi do kontekstu, wiedzy i geolokalizacji użytkownika. Potrafi proaktywnie wskazywać kwestie do omówienia z lekarzem, zachowując bezpieczeństwo informacji.

Bezpieczeństwo, personalizacja i mniejsze ryzyko halucynacji

GPT-5 redukuje odsetek odpowiedzi zawierających błędy faktograficzne o ~45% w porównaniu z GPT-4o i o ~80% względem OpenAI o3 w trybie rozumowania. Mechanizm „safe completions” pozwala częściowo odpowiadać na pytania, w których pełna informacja mogłaby zostać wykorzystana w sposób szkodliwy — np. w biologii model poda wyłącznie ogólne informacje, bez szczegółów umożliwiających odtworzenie niebezpiecznych procesów. Model lepiej rozpoznaje własne ograniczenia — w testach na brakujących multimodalnych danych zredukował wskaźnik nieprawdziwych zapewnień z 86,7% (OpenAI o3) do 9%. W ChatGPT wprowadzono też cztery style osobowości (Cynic, Robot, Listener, Nerd), oparte na poprawionej sterowalności (steerability) modelu, oraz dodatkowe zabezpieczenia w obszarze biologii i chemii zgodne z ramami Preparedness Framework.

Avatar
Apr 21, 2023

iOS 17 ewentualnie umożliwi instalowanie aplikacji z zewnętrznych źródeł

Od momentu, gdy pierwszy iPhone trafił do sprzedaży firma Apple sprzeciwiała się instalowaniu aplikacji z zewnętrznych źródeł, ale to może wkrótce zmienić się. Jak informuje Mark Gurman, znany analityk Apple, w iOS 17 ma pojawić się taka opcja.
0
Feb 4, 2025

DeepSeek wydało ponad 1,6 mld dolarów na szkolenie AI, a nie 6 mln

Chiński startup AI DeepSeek zainwestował około 1,6 miliarda dolarów w szkolenie swojej zaawansowanej modeli językowej R1, mimo że wcześniejsze doniesienia sugerowały znacznie niższy budżet wynoszący 6 milionów dolarów – wynika z raportu SemiAnalysis.
0
May 21

AMD prezentuje karty graficzne Radeon RX 9060 XT i AI PRO R9700 oraz nowe procesory Threadripper 9000

Na targach Computex 2025 firma AMD ogłosiła szereg premier skierowanych zarówno do graczy, jak i profesjonalistów pracujących z zaawansowanymi modelami AI. Wśród nowości znalazły się dwie karty graficzne oparte na architekturze RDNA 4 oraz nowa generacja procesorów Ryzen Threadripper 9000 z maksymalnie 96 rdzeniami.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies