OpenAI uruchamia Flex – tańszy tryb API w zamian za wolniejsze działanie

OpenAI uruchamia Flex – tańszy tryb API w zamian za wolniejsze działanie

OpenAI zaprezentowało nową opcję korzystania z modeli sztucznej inteligencji, która pozwala obniżyć koszty obsługi zadań asynchronicznych i testowych. Tryb Flex, dostępny w wersji beta, zapewnia niższe opłaty za przetwarzanie, oferując jednak wolniejszy czas odpowiedzi oraz ryzyko czasowej niedostępności zasobów. Rozwiązanie jest skierowane do projektów, które nie wymagają natychmiastowych rezultatów, np. podczas ewaluacji modeli czy wzbogacania zbiorów danych.

Elastyczne ceny i specyfika korzystania z API

Tryb Flex redukuje koszty użytkowania nawet o połowę w porównaniu do standardowych stawek. Dla modelu o3 ceny wynoszą odpowiednio 5 dolarów zamiast 10 dolarów za milion tokenów na wejściu oraz 20 zamiast 40 dolarów za milion tokenów na wyjściu. Z kolei dla mniejszego modelu o4-mini opłaty spadają z 1,10 do 0,55 dolara za milion tokenów na wejściu oraz z 4,40 do 2,20 dolarów za milion tokenów na wyjściu.

Ze względu na wolniejsze działanie, OpenAI zaleca zwiększenie domyślnych limitów czasowych API do około 15 minut oraz wdrożenie mechanizmów ponawiania zapytań z coraz dłuższymi przerwami. Firma zapewnia, że w przypadku braku zasobów (błąd 429) użytkownicy nie ponoszą dodatkowych kosztów. Jeśli jednak szybkość odpowiedzi jest priorytetem, można łatwo przełączyć się z trybu Flex na standardowy.

Nowe wymagania weryfikacji

Równocześnie z uruchomieniem trybu Flex, OpenAI przypomina, że organizacje korzystające z modeli o3 oraz zaawansowanych funkcji API będą musiały przejść nowy proces weryfikacji tożsamości. Dotyczy to użytkowników z poziomów 1–3, czyli organizacji najaktywniej korzystających z platformy.

Flex jest próbą konkurencyjnej odpowiedzi OpenAI na rosnące ceny modeli AI oraz tańsze propozycje innych firm, takich jak Google czy DeepSeek. Nowy tryb pozwala deweloperom oraz zespołom badawczym efektywniej kontrolować wydatki przy mniej priorytetowych zadaniach, zachowując dostęp do zaawansowanych możliwości modeli reasoningowych.

Avatar
Kwi 6

Axios padł ofiarą ataku na łańcuch dostaw

Niedawno branża mierzyła się z incydentem dotyczącym pakietu Litellm w PyPI, a w nocy z 30 na 31 marca hakerzy skompromitowali Axios — jeden z najczęściej używanych klientów HTTP w ekosystemie JavaScript, pobierany ponad 100 milionów razy tygodniowo i wykorzystywany w wielu projektach. Badacze ustalili, że napastnicy opublikowali zainfekowane wersje Axios bezpośrednio w npm, omijając oficjalne repozytorium projektu na GitHubie.
0
Lut 7, 2023

Microsoft, GitHub i OpenAI. Czy tym razem „Piratom z Doliny Krzemowej” znowu zejdzie z rąk?

Obrońcy prawni od Microsoft, Github, and OpenAI domagają się oddalenia skargi, która twierdzi, że Copilot opiera się na "piractwie komputerowym na niespotykaną dotąd skalę".
0
Mar 7, 2024

17-letni programista od półtora roku mieszka w niemieckich pociągach

Chłopak żyje jako cyfrowy nomada bez stałego miejsca zamieszkania w pociągach Deutsche Bahn (DB). W nocy śpi na ich siedzeniach, w ciągu dnia pracuje jako programista w otoczeniu innych pasażerów i podróżuje po całym kraju.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies