DeepSeek R1 dostępny na Hugging Face

DeepSeek R1 dostępny na Hugging Face

DeepSeek zaktualizował swój model AI R1, wyposażony w zdolność rozumowania. Jak podają twórcy, zmiany są niewielkie — poprawiają nieco zdolność modelu do radzenia sobie z bardziej złożonymi zadaniami.

R1 nadal nie dorównuje liderom rankingów, ale znacząco przewyższa wcześniejsze wersje tego samego modelu.

Hugging Face

Co ważniejsze — chiński model trafił na platformę Hugging Face.

Został udostępniony na licencji MIT, która pozwala na komercyjne wykorzystanie modelu w dowolnych celach. Oznacza to, że naukowcy i firmy na całym świecie mogą go samodzielnie wdrożyć i przetestować — jako alternatywę dla wielu modeli zachodnich.

Trzeba jednak pamiętać, że model jest ogromny — zawiera aż 685 miliardów parametrów. To oznacza konieczność posiadania bardzo wydajnego sprzętu.

Istnieją odchudzone wersje, które można uruchomić na jednej karcie RTX 5090, ale są one raczej wyjątkiem niż regułą.

Uwaga: Repozytorium na Hugging Face nie zawiera opisu modelu — dostępne są tylko pliki konfiguracyjne i parametry.


Avatar
Cze 20

Google szkoli swoje modele AI na filmach z YouTube – bez zgody twórców

Google wykorzystuje część biblioteki YouTube do trenowania modeli generatywnych, takich jak Gemini i Veo 3 – nowy generator treści wideo i audio oparty na AI. Firma potwierdziła, że korzysta z wybranych materiałów z platformy, jednak według ekspertów większość twórców nie miała świadomości, że ich treści są przetwarzane w tym celu
0
Lip 14

Grok 4 debiutuje dzień po incydencie z treściami nazistowskimi. xAI zapowiada agentowe modele i nowe funkcje

Firma xAI zaprezentowała dwa nowe modele — Grok 4 oraz Grok 4 Heavy — zaledwie dzień po tym, jak chatbot Grok wygenerował na platformie X odpowiedzi zawierające antysemickie odniesienia. Według xAI wersja Heavy korzysta z architektury multi-agentowej, w której wiele instancji modelu analizuje zapytanie równolegle, a następnie porównuje wyniki przed udzieleniem odpowiedzi. To podejście, określane jako test-time compute scaling, zwiększa wykorzystanie mocy obliczeniowej podczas wnioskowania.
0
Lut 1, 2024

PayPal zlikwiduje 2500 miejsc pracy

PayPal Holdings Inc. zredukuje zatrudnienie o około 9%, a to 2500 miejsc pracy.
0

Ta strona używa plików cookie, aby zapewnić Ci lepsze wrażenia podczas przeglądania.

Dowiedz się więcej o tym, jak używamy plików cookie i jak zmienić preferencje dotyczące plików cookie w naszej Polityka plików cookie.

Zmień ustawienia
Zapisz Akceptuj wszystkie cookies