DeepSeek R1 dostępny na Hugging Face

DeepSeek R1 dostępny na Hugging Face

DeepSeek zaktualizował swój model AI R1, wyposażony w zdolność rozumowania. Jak podają twórcy, zmiany są niewielkie — poprawiają nieco zdolność modelu do radzenia sobie z bardziej złożonymi zadaniami.

R1 nadal nie dorównuje liderom rankingów, ale znacząco przewyższa wcześniejsze wersje tego samego modelu.

Hugging Face

Co ważniejsze — chiński model trafił na platformę Hugging Face.

Został udostępniony na licencji MIT, która pozwala na komercyjne wykorzystanie modelu w dowolnych celach. Oznacza to, że naukowcy i firmy na całym świecie mogą go samodzielnie wdrożyć i przetestować — jako alternatywę dla wielu modeli zachodnich.

Trzeba jednak pamiętać, że model jest ogromny — zawiera aż 685 miliardów parametrów. To oznacza konieczność posiadania bardzo wydajnego sprzętu.

Istnieją odchudzone wersje, które można uruchomić na jednej karcie RTX 5090, ale są one raczej wyjątkiem niż regułą.

Uwaga: Repozytorium na Hugging Face nie zawiera opisu modelu — dostępne są tylko pliki konfiguracyjne i parametry.


Avatar
Mar 21, 2024

Intel otrzymuje 8,5 miliarda dolarów na budowę fabryk układów scalonych

Prezydent Biden przyznał w środę 8,5 miliarda dolarów w formie dotacji dla firmy Intel, co stanowi znaczącą inwestycję mającą wzmocnić produkcję półprzewodników w Stanach Zjednoczonych.
0
Dec 21, 2022

Microsoft może kupić Netflix w 2023 roku za $190 mld

Technologiczny gigant Microsoft zamierza kupić serwis streamingowy Netflix.
1
Jul 3, 2023

11 bit studios zaprasza graczy w Polsce do testowania The Alters

Polska firma 11 bit studios ogłosiła nabór uczestników do testów The Alters.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies