OpenAI uruchamia nowy generator obrazów w ChatGPT – teraz dostępny również dla użytkowników bezpłatnych

OpenAI uruchamia nowy generator obrazów w ChatGPT – teraz dostępny również dla użytkowników bezpłatnych

OpenAI wprowadza nową funkcję tworzenia i edytowania obrazów bezpośrednio w ChatGPT, opartą na modelu GPT-4o. To pierwsze duże rozszerzenie możliwości graficznych tego chatbota od czasu integracji z DALL-E 3. Funkcja jest już dostępna dla subskrybentów planu Pro, a wkrótce trafi także do użytkowników wersji Plus i darmowej, jak również do deweloperów korzystających z API.

Większa precyzja i edycja obrazów dzięki GPT-4o

W przeciwieństwie do modelu DALL-E, GPT-4o generuje obrazy metodą autoregresyjną – obraz powstaje stopniowo, od lewej do prawej i z góry na dół, podobnie jak tekst. Choć proces ten trwa dłużej, ma zapewniać większą precyzję i wyrazistość detali. Model potrafi również modyfikować istniejące obrazy, w tym także z postaciami ludzkimi – poprzez przekształcenie sylwetki lub dodawanie elementów tła i pierwszego planu.

GPT-4o, jako model „omnimodalny”, lepiej rozumie złożone prompt’y, które obejmują kilka obiektów czy złożoną strukturę kompozycyjną. OpenAI twierdzi, że nowy system również lepiej radzi sobie z generowaniem tekstu na obrazach, co było dotąd piętą achillesową wielu narzędzi.

Ograniczenia, bezpieczeństwo i podejście do danych treningowych

Darmowe limity pozostają takie jak wcześniej dla DALL-E, choć firma nie podaje konkretnej liczby wygenerowanych obrazów – limit może być dynamicznie dostosowywany w zależności od obciążenia systemu.

OpenAI zaznacza, że generator posiada solidne zabezpieczenia przed nadużyciami: blokuje tworzenie treści seksualnych, usuwanie znaków wodnych oraz generowanie materiałów CSAM. Obrazy nie są oznaczane widocznymi znakami wodnymi, ale zawierają metadane C2PA, które wskazują na ich sztuczne pochodzenie.

Według OpenAI, dane treningowe dla GPT-4o pochodziły z zasobów publicznych oraz partnerstw z firmami takimi jak Shutterstock. Firma zapewnia, że nie imituje stylów żyjących artystów i umożliwia twórcom rezygnację z wykorzystania ich prac w procesie treningowym.

Nowa funkcja generowania obrazów pojawia się w kontekście rywalizacji z Google, którego model Gemini 2.0 Flash wywołał kontrowersje związane z brakiem zabezpieczeń w generowanych obrazach. W odróżnieniu od niego, OpenAI podkreśla nacisk na bezpieczeństwo i ochronę praw twórców.

Avatar
Kwi 24

OpenAI wprowadza GPT‑4.1 — nową rodzinę modeli zoptymalizowanych pod kątem kodowania i zadań z długim kontekstem

OpenAI udostępniła trzy nowe modele językowe w API: GPT‑4.1, GPT‑4.1 mini oraz GPT‑4.1 nano. Wszystkie obsługują kontekst o długości do 1 miliona tokenów i oferują istotne usprawnienia w zakresie pisania kodu, rozumienia długiego kontekstu oraz przestrzegania instrukcji. Modele nie są dostępne w ChatGPT, ale można je wykorzystać w aplikacjach poprzez interfejs API.
0
Kwi 11

Trump zmienia zdanie w sprawie ograniczeń eksportu chipów H20 po kolacji z CEO Nvidii

Administracja Donalda Trumpa niespodziewanie zrezygnowała z planowanego zakazu eksportu chipów H20 do Chin — najnowocześniejszych układów AI, które amerykańskie firmy mogą legalnie sprzedawać na rynek chiński. Decyzję ogłoszono po kolacji w Mar-a-Lago, na którą zaproszono także CEO Nvidii, Jensena Huanga. Koszt jednego miejsca przy stole wynosił milion dolarów.
0
Cze 24

„Ważne, by nie zapomnieć, jak pisać kod ręcznie”: CEO GitHuba o tym, dlaczego nie warto polegać wyłącznie na AI

CEO GitHuba, Thomas Dohmke, zaznaczył, że nawet w czasach, gdy sztuczna inteligencja aktywnie generuje kod, programiści nie powinni zapominać, jak robić to samodzielnie. Ostrzega, że całkowite poleganie na autogenerowaniu może prowadzić do utraty istotnych umiejętności i czasu.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies