OpenAI wprowadza GPT‑4.1 — nową rodzinę modeli zoptymalizowanych pod kątem kodowania i zadań z długim kontekstem

OpenAI udostępniła trzy nowe modele językowe w API: GPT‑4.1, GPT‑4.1 mini oraz GPT‑4.1 nano. Wszystkie obsługują kontekst o długości do 1 miliona tokenów i oferują istotne usprawnienia w zakresie pisania kodu, rozumienia długiego kontekstu oraz przestrzegania instrukcji. Modele nie są dostępne w ChatGPT, ale można je wykorzystać w aplikacjach poprzez interfejs API.

Zoptymalizowane do pracy z kodem i precyzyjnych instrukcji

GPT‑4.1 uzyskuje 54,6% skuteczności w teście SWE-bench Verified, co oznacza znaczną poprawę w porównaniu do GPT‑4o i GPT‑4.5. W testach modyfikacji kodu model wprowadza mniej zbędnych zmian i trafniej przestrzega oczekiwanych struktur różnic (diff). W ocenie projektów stron internetowych przygotowanych przez model, płatni recenzenci preferowali wersje stworzone przez GPT‑4.1 w 80% przypadków.

Pod względem przestrzegania złożonych instrukcji model osiąga 38,3% w benchmarku MultiChallenge, co stanowi wzrost o 10,5 punktu procentowego względem GPT‑4o. Ulepszono także odporność na nadmierną pewność siebie i dokładność śledzenia wieloetapowych poleceń.

Milion tokenów kontekstu i praktyczne zastosowania

Wszystkie modele z serii GPT‑4.1 obsługują do 1 miliona tokenów kontekstu, co pozwala analizować obszerne zbiory dokumentów lub repozytoria kodu. W benchmarku Video-MME model osiągnął 72% skuteczności w kategorii „długie wideo bez napisów”. W wewnętrznych testach OpenAI model potrafił skutecznie wyszukiwać potrzebne dane rozproszone po całym kontekście.

Wersje mini i nano oferują mniejsze zużycie zasobów i niższe opóźnienia. GPT‑4.1 nano osiąga 80,1% w teście MMLU i przewyższa GPT‑4o mini pod względem wydajności, będąc jednocześnie najtańszym modelem OpenAI.

Nowe możliwości i ceny API

GPT‑4.1 dostępny jest wyłącznie poprzez API. Jego ceny wynoszą odpowiednio: $2 za milion tokenów wejściowych i $8 za wyjściowych; wersja mini kosztuje $0,40 / $1,60; nano – $0,10 / $0,40.

Wersje 4.1 stanowią bezpośrednie rozwinięcie GPT‑4.5, który zostanie wycofany z API w lipcu 2025 roku. Wg OpenAI, GPT‑4.1 zapewnia lepsze lub porównywalne wyniki przy niższych kosztach i opóźnieniach. Modele te zaprojektowano jako podstawę do tworzenia autonomicznych agentów AI wspierających zadania inżynierskie, obsługę klienta czy przetwarzanie danych prawnych.

Zoom przywrócił działanie po kilkugodzinnej awarii

W środę po południu użytkownicy na całym świecie doświadczyli problemów z dostępem do platformy Zoom. Awaria rozpoczęła się około godziny 17:30 czasu polskiego i osiągnęła szczyt w ciągu kolejnych 30 minut – według serwisu DownDetector.com, ponad 59 tys. osób zgłosiło problemy z usługą.

Iran publikuje fałszywe nagrania zestrzeleń izraelskich myśliwców, wykorzystując ujęcia z Arma 3 i innej gry

Od 13 czerwca na Bliskim Wschodzie trwa wojna między Izraelem a Iranem. Po tym, jak państwo żydowskie przeprowadziło serię skutecznych ataków, rząd ajatollahów zaczął odpowiadać atakami rakietowymi. Gry komputerowe stały się jednym z narzędzi propagandy w tym konflikcie. Irańskie wojsko wykorzystało ujęcia z Arma 3 oraz rosyjskiej gry War Thunder, aby zaprezentować sfabrykowane zestrzelenia izraelskich samolotów. Nagrania te były intensywnie rozpowszechniane w mediach społecznościowych.

Newsy