OpenAI planuje pierwszy od lat otwarty model językowy

OpenAI planuje pierwszy od lat otwarty model językowy

OpenAI zapowiedziało, że w najbliższych miesiącach udostępni nowy model językowy z otwartymi wagami (ang. open-weight), który będzie można uruchamiać lokalnie — na własnym sprzęcie. To pierwszy taki krok firmy od czasu GPT‑2, a jednocześnie wyraźny sygnał zmiany podejścia w kierunku większej otwartości. Nowy system ma oferować możliwości reasoningowe porównywalne z modelem o3-mini.

Firma ogłosiła rozpoczęcie konsultacji z badaczami, programistami i całą społecznością, publikując specjalny formularz opinii oraz zapowiadając serię spotkań — najpierw w San Francisco, później w Europie i regionie Azji i Pacyfiku. Celem jest zebranie jak najwięcej sugestii i potrzeb dotyczących nowego modelu oraz jego funkcjonalności.

CEO OpenAI, Sam Altman, nie ukrywa, że dotychczasowe podejście firmy do kwestii open source wymaga przemyślenia. W niedawnym AMA na Reddicie przyznał: „Być może byliśmy po niewłaściwej stronie historii, jeśli chodzi o otwartość”. Jednocześnie zapowiedział, że nowy model będzie wyposażony w możliwości reasoningowe zbliżone do o3-mini, a firma przeprowadzi dodatkowe kontrole bezpieczeństwa przed jego premierą, wiedząc, że model będzie później modyfikowany przez społeczność.

Decyzja OpenAI może być reakcją na rosnącą presję ze strony konkurentów. Meta chwaliła się w marcu, że jej rodzina modeli Llama została pobrana już ponad miliard razy, a chińskie laboratorium DeepSeek zyskuje szybko popularność dzięki otwartym modelom i wsparciu lokalnych inwestorów.

O planach realizacji modelu przypomniał także jeden z dyrektorów OpenAI: 

 We’re releasing a model this year that you can run on your own hardware

Steven Heidel

Sam Altman odniósł się do tego szerzej we własnym poście w X:

https://x.com/sama/status/1906793591944646898
https://x.com/sama/status/1906793591944646898

Avatar
Kwi 22

NVIDIA może zacząć projektować chipy AI specjalnie dla Chin i DeepSeek

NVIDIA rozważa opracowanie nowych chipów AI dostosowanych do potrzeb rynku chińskiego. Według WccfTech firma prowadzi rozmowy z lokalnym podmiotem DeepSeek, by wspólnie projektować układy, które mogłyby zostać wyłączone spod amerykańskich ograniczeń eksportowych.
0
Cze 25

Cloudflare powstrzymało nowy, rekordowo silny cyberatak o intensywności 7,3 Tb/s

Firma Cloudflare poinformowała, że udało jej się zatrzymać atak na serwer, podczas którego ruch osiągnął 7,3 terabita na sekundę. Dla porównania — to tak, jakby ktoś próbował przesłać ci jednocześnie 9 000 filmów w jakości HD w ciągu 45 sekund.
0
Sty 31, 2024

Google wydał miliardy dolarów na zwolnienia pracowników

Firma wydała kolejne 700 milionów dolarów na zwolnienia tylko w tym miesiącu, nawet pomimo odnotowania wzrostu we wszystkich swoich działach: reklamowym, chmurowym i usługowym.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies