OpenAI uruchamia nowy generator obrazów w ChatGPT – teraz dostępny również dla użytkowników bezpłatnych

OpenAI uruchamia nowy generator obrazów w ChatGPT – teraz dostępny również dla użytkowników bezpłatnych

OpenAI wprowadza nową funkcję tworzenia i edytowania obrazów bezpośrednio w ChatGPT, opartą na modelu GPT-4o. To pierwsze duże rozszerzenie możliwości graficznych tego chatbota od czasu integracji z DALL-E 3. Funkcja jest już dostępna dla subskrybentów planu Pro, a wkrótce trafi także do użytkowników wersji Plus i darmowej, jak również do deweloperów korzystających z API.

Większa precyzja i edycja obrazów dzięki GPT-4o

W przeciwieństwie do modelu DALL-E, GPT-4o generuje obrazy metodą autoregresyjną – obraz powstaje stopniowo, od lewej do prawej i z góry na dół, podobnie jak tekst. Choć proces ten trwa dłużej, ma zapewniać większą precyzję i wyrazistość detali. Model potrafi również modyfikować istniejące obrazy, w tym także z postaciami ludzkimi – poprzez przekształcenie sylwetki lub dodawanie elementów tła i pierwszego planu.

GPT-4o, jako model „omnimodalny”, lepiej rozumie złożone prompt’y, które obejmują kilka obiektów czy złożoną strukturę kompozycyjną. OpenAI twierdzi, że nowy system również lepiej radzi sobie z generowaniem tekstu na obrazach, co było dotąd piętą achillesową wielu narzędzi.

Ograniczenia, bezpieczeństwo i podejście do danych treningowych

Darmowe limity pozostają takie jak wcześniej dla DALL-E, choć firma nie podaje konkretnej liczby wygenerowanych obrazów – limit może być dynamicznie dostosowywany w zależności od obciążenia systemu.

OpenAI zaznacza, że generator posiada solidne zabezpieczenia przed nadużyciami: blokuje tworzenie treści seksualnych, usuwanie znaków wodnych oraz generowanie materiałów CSAM. Obrazy nie są oznaczane widocznymi znakami wodnymi, ale zawierają metadane C2PA, które wskazują na ich sztuczne pochodzenie.

Według OpenAI, dane treningowe dla GPT-4o pochodziły z zasobów publicznych oraz partnerstw z firmami takimi jak Shutterstock. Firma zapewnia, że nie imituje stylów żyjących artystów i umożliwia twórcom rezygnację z wykorzystania ich prac w procesie treningowym.

Nowa funkcja generowania obrazów pojawia się w kontekście rywalizacji z Google, którego model Gemini 2.0 Flash wywołał kontrowersje związane z brakiem zabezpieczeń w generowanych obrazach. W odróżnieniu od niego, OpenAI podkreśla nacisk na bezpieczeństwo i ochronę praw twórców.

Avatar
Apr 9

Trump chce przenieść produkcję iPhone’ów do USA

Na kilka dni przed wejściem w życie nowych taryf handlowych ogłoszonych przez prezydenta Donalda Trumpa, sekretarz prasowa Białego Domu Karoline Leavitt zasugerowała, że Apple może rozważać przeniesienie produkcji iPhone’ów do Stanów Zjednoczonych — wynika z informacji przekazanych przez serwis The Verge. Jako argument wskazała plan inwestycyjny firmy o wartości 500 miliardów dolarów. Jej zdaniem: „Gdyby Apple uważało, że to niemożliwe, prawdopodobnie nie planowaliby tak dużych inwestycji w USA”.
0
Aug 11

Linus Torvalds krytykuje kod RISC-V od inżyniera Google: „To śmieci, które czynią świat gorszym miejscem”

Założyciel i główny twórca systemu Linux, Linus Torvalds, odrzucił propozycję włączenia kodu dla architektury RISC-V przesłaną przez inżyniera Google, określając ją jako „śmieci”. Pull request dotyczący wersji Linux 6.17 został wysłany 8 sierpnia, jednak Torvalds skrytykował zarówno jego jakość, jak i zbyt późny termin dostarczenia.
0
Jun 25

Cloudflare powstrzymało nowy, rekordowo silny cyberatak o intensywności 7,3 Tb/s

Firma Cloudflare poinformowała, że udało jej się zatrzymać atak na serwer, podczas którego ruch osiągnął 7,3 terabita na sekundę. Dla porównania — to tak, jakby ktoś próbował przesłać ci jednocześnie 9 000 filmów w jakości HD w ciągu 45 sekund.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies