DeepSeek R1 dostępny na Hugging Face

DeepSeek zaktualizował swój model AI R1, wyposażony w zdolność rozumowania. Jak podają twórcy, zmiany są niewielkie — poprawiają nieco zdolność modelu do radzenia sobie z bardziej złożonymi zadaniami.

R1 nadal nie dorównuje liderom rankingów, ale znacząco przewyższa wcześniejsze wersje tego samego modelu.

Hugging Face

Co ważniejsze — chiński model trafił na platformę Hugging Face.

Został udostępniony na licencji MIT, która pozwala na komercyjne wykorzystanie modelu w dowolnych celach. Oznacza to, że naukowcy i firmy na całym świecie mogą go samodzielnie wdrożyć i przetestować — jako alternatywę dla wielu modeli zachodnich.

Trzeba jednak pamiętać, że model jest ogromny — zawiera aż 685 miliardów parametrów. To oznacza konieczność posiadania bardzo wydajnego sprzętu.

Istnieją odchudzone wersje, które można uruchomić na jednej karcie RTX 5090, ale są one raczej wyjątkiem niż regułą.

Uwaga: Repozytorium na Hugging Face nie zawiera opisu modelu — dostępne są tylko pliki konfiguracyjne i parametry.

OpenAI wprowadza GPT‑4.1 — nową rodzinę modeli zoptymalizowanych pod kątem kodowania i zadań z długim kontekstem

OpenAI udostępniła trzy nowe modele językowe w API: GPT‑4.1, GPT‑4.1 mini oraz GPT‑4.1 nano. Wszystkie obsługują kontekst o długości do 1 miliona tokenów i oferują istotne usprawnienia w zakresie pisania kodu, rozumienia długiego kontekstu oraz przestrzegania instrukcji. Modele nie są dostępne w ChatGPT, ale można je wykorzystać w aplikacjach poprzez interfejs API.

Newsy

DeepSeek R1 dostępny na Hugging Face

Hugging Face

Management Salaries

Polska drużyna wygrywa cybernetyczny konkurs NATO

OpenAI wprowadza GPT‑4.1 — nową rodzinę modeli zoptymalizowanych pod kątem kodowania i zadań z długim kontekstem

Wzrost przychodów ukraińskich startupów w 2022 o 542 mln USD