DeepSeek R1 dostępny na Hugging Face

DeepSeek R1 dostępny na Hugging Face

DeepSeek zaktualizował swój model AI R1, wyposażony w zdolność rozumowania. Jak podają twórcy, zmiany są niewielkie — poprawiają nieco zdolność modelu do radzenia sobie z bardziej złożonymi zadaniami.

R1 nadal nie dorównuje liderom rankingów, ale znacząco przewyższa wcześniejsze wersje tego samego modelu.

Hugging Face

Co ważniejsze — chiński model trafił na platformę Hugging Face.

Został udostępniony na licencji MIT, która pozwala na komercyjne wykorzystanie modelu w dowolnych celach. Oznacza to, że naukowcy i firmy na całym świecie mogą go samodzielnie wdrożyć i przetestować — jako alternatywę dla wielu modeli zachodnich.

Trzeba jednak pamiętać, że model jest ogromny — zawiera aż 685 miliardów parametrów. To oznacza konieczność posiadania bardzo wydajnego sprzętu.

Istnieją odchudzone wersje, które można uruchomić na jednej karcie RTX 5090, ale są one raczej wyjątkiem niż regułą.

Uwaga: Repozytorium na Hugging Face nie zawiera opisu modelu — dostępne są tylko pliki konfiguracyjne i parametry.


Avatar
Dec 17, 2022

John Carmack odchodzi z Meta. „Zmęczyłem się walką”

Carmack, znany ze swojej pracy w VR i klasycznych grach, takich jak Doom i Quake, rezygnuje ze stanowiska konsultanta CTO w Meta.
0
Feb 19, 2024

Fani Apple zaczynają zwracać swoje Vision Pro

Niewygoda, ból głowy i zmęczenie oczu to jedne z głównych powodów, dla których użytkownicy zwracają zestawy słuchawkowe Vision Pro.
0
Feb 9

Anders Hejlsberg: dlaczego TypeScript przepisano na Go, a nie na Rust, i co dalej z juniorami

GitHub opublikował wywiad z Andersem Hejlsbergiem — architektem C# i TypeScript oraz twórcą Turbo Pascala i Delphi. Opowiada on o kilku kwestiach, które w ostatnim czasie budzą sporo dyskusji.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies