OpenAI ogranicza losowe odniesienia do goblinów w Codexie

OpenAI ogranicza losowe odniesienia do goblinów w Codexie

OpenAI dodała do instrukcji Codex CLI ograniczenie, zgodnie z którym model nie powinien wspominać o goblinach, gremlinach, szopach, trollach, ograch, gołębiach ani innych zwierzętach lub stworzeniach, jeśli nie jest to „absolutnie i jednoznacznie” związane z pytaniem użytkownika, – informuje WIRED. Zapis dotyczy Codex CLI, czyli narzędzia CLI do pracy z kodem przy użyciu AI.

Skąd wzięło się ograniczenie dotyczące goblinów

Nietypowy zapis przyciągnął uwagę nie tylko ze względu na samą treść, ale też dlatego, że według Business Insidera podobna instrukcja pojawia się w kodzie cztery razy. OpenAI próbowała w ten sposób ograniczyć sytuacje, w których GPT-5.5 dodawał do technicznych odpowiedzi przypadkowe określenia związane z goblinami, gremlinami lub innymi stworzeniami.

Business Insider przytacza przykłady odpowiedzi GPT-5.5, w których pojawiały się frazy takie jak „filthy neon sparkle goblin mode”, „goblin bandwidth” oraz „an even shorter goblin version”. W innym przykładzie model użył określenia „perf gremlin” przy opisie działania procesu. W narzędziu przeznaczonym do pracy z kodem takie dodatki nie pomagały w zrozumieniu błędu ani w wykonaniu zadania programistycznego.

OpenAI wskazuje na wpływ osobowości „Nerdy”

OpenAI opublikowała osobne wyjaśnienie zatytułowane „Where the goblins came from”. Firma napisała, że pierwsze wyraźne sygnały tego zachowania zauważyła w listopadzie, po uruchomieniu GPT-5.1. Użytkownicy zwracali wtedy uwagę, że model brzmi w rozmowach zbyt swobodnie, dlatego OpenAI sprawdziła także powtarzające się słowa i określenia pojawiające się w odpowiedziach.

Po analizie danych firma ustaliła, że po premierze GPT-5.1 użycie słowa „goblin” w ChatGPT wzrosło o 175%, a „gremlin” — o 52%. Przy GPT-5.4 OpenAI odnotowała większy wzrost takich odniesień i powiązała go z osobowością „Nerdy”. Według danych ta osobowość odpowiadała za 2,5% wszystkich odpowiedzi ChatGPT, ale za 66,7% przypadków użycia słowa „goblin”.

OpenAI ustaliła też, że odpowiedzi zawierające słowa „goblin” lub „gremlin” częściej otrzymywały wyższą ocenę podczas trenowania wariantu „Nerdy”. Firma wycofała ten wariant w marcu, po uruchomieniu GPT-5.4. Z procesu trenowania usunięto mechanizm sprzyjający takim odpowiedziom, a dane zawierające słowa związane ze stworzeniami były filtrowane.

Dlaczego problem wrócił w GPT-5.5

GPT-5.5 zaczęto trenować, zanim OpenAI ustaliła przyczynę tego zachowania. Gdy model trafił do testów w Codexie, pracownicy OpenAI ponownie zauważyli skłonność do takich sformułowań i dodali instrukcję, która miała ograniczyć ten efekt.

Według OpenAI ta sytuacja pokazuje, że sposób oceniania odpowiedzi może wpływać na zachowanie modelu w nieoczekiwany sposób. Styl utrwalony w jednym wariancie, w tym przypadku w „Nerdy”, może później pojawić się w innym kontekście, zwłaszcza jeśli wygenerowane odpowiedzi trafiają do danych używanych podczas dalszego trenowania.

W przypadku Codexu problem był widoczny w narzędziu do pracy z kodem. Użytkownik oczekuje tam zwykle technicznej odpowiedzi, a nie dodatkowych określeń stylistycznych. Dlatego ograniczenie w instrukcjach nie dotyczy samego słowa „goblin”, lecz ograniczenia przypadkowych nawiązań, które nie pomagają w rozwiązaniu zadania programistycznego.


Avatar
Sty 13, 2025

BATMMAAN — nowy akronim zamiast FAANG

FAANG i MANGA odchodzą w cień, a na ich miejsce pojawił się nowy akronim — BATMMAAN. Czy w Waszej głowie pojawiło się logo czarnego nietoperza na żółtym tle? Niestety lub na szczęście, ten akronim nie ma nic wspólnego ze znanym superbohaterem.
0
Kwi 1, 2025

Zuckerberg szuka wsparcia Trumpa, by uniknąć miliardowej kary od UE dla Meta

Mark Zuckerberg próbuje zdobyć wsparcie Donalda Trumpa w kontekście zbliżającej się decyzji Unii Europejskiej o nałożeniu kary finansowej na Meta. Zgodnie z informacjami The Wall Street Journal, Komisja Europejska planuje nałożyć grzywnę na firmę za naruszenie przepisów ustawy o rynkach cyfrowych (DMA), uznając model reklamowy „zapłać albo wyraź zgodę” stosowany na Facebooku i Instagramie za niezgodny z prawem.
0
Maj 22, 2025

Google I/O 2025: AI w centrum wszystkich ogłoszeń

Podczas tegorocznej konferencji Google I/O 2025, która odbyła się 14 maja w Mountain View, firma zaprezentowała szereg nowych funkcji związanych ze sztuczną inteligencją – zarówno w narzędziach dla użytkowników końcowych, jak i deweloperów. Jak informuje portal TechCrunch, kluczowe nowości objęły m.in. model Gemini Ultra, Veo 3, nową wersję generatora obrazów Imagen 4, oraz Gemini Live z funkcją rozmów z AI w czasie rzeczywistym.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies