DeepSeek R1 dostępny na Hugging Face

DeepSeek R1 dostępny na Hugging Face

DeepSeek zaktualizował swój model AI R1, wyposażony w zdolność rozumowania. Jak podają twórcy, zmiany są niewielkie — poprawiają nieco zdolność modelu do radzenia sobie z bardziej złożonymi zadaniami.

R1 nadal nie dorównuje liderom rankingów, ale znacząco przewyższa wcześniejsze wersje tego samego modelu.

Hugging Face

Co ważniejsze — chiński model trafił na platformę Hugging Face.

Został udostępniony na licencji MIT, która pozwala na komercyjne wykorzystanie modelu w dowolnych celach. Oznacza to, że naukowcy i firmy na całym świecie mogą go samodzielnie wdrożyć i przetestować — jako alternatywę dla wielu modeli zachodnich.

Trzeba jednak pamiętać, że model jest ogromny — zawiera aż 685 miliardów parametrów. To oznacza konieczność posiadania bardzo wydajnego sprzętu.

Istnieją odchudzone wersje, które można uruchomić na jednej karcie RTX 5090, ale są one raczej wyjątkiem niż regułą.

Uwaga: Repozytorium na Hugging Face nie zawiera opisu modelu — dostępne są tylko pliki konfiguracyjne i parametry.


Avatar
Jul 29

Temu naruszyło przepisy UE dotyczące sprzedaży nielegalnych produktów

Platforma e-commerce Temu została oficjalnie uznana przez Komisję Europejską za podmiot objęty przepisami aktu o usługach cyfrowych (DSA), co oznacza konieczność natychmiastowego dostosowania się do europejskich regulacji
0
Jan 9, 2025

Sam Altman odpowiedział na pozew z zarzutami o przemoc seksualną wobec swojej siostry

Dyrektor generalny OpenAI, Sam Altman, we wtorek odniósł się do oskarżeń o przemoc seksualną wysuniętych przez jego młodszą siostrę, nazywając te zarzuty „całkowicie nieprawdziwymi”. O czym mowa w pozwie? Według informacji opublikowanych w Saint Louis Post Dispatch, w nowym pozwie złożonym w poniedziałek, Annie Altman oskarżyła swojego starszego brata o stosowanie przemocy seksualnej przez dziewięć lat w latach 1990 i 2000. Pozew ten powtarza zarzuty, które Annie już wcześniej przedstawiała w mediach społecznościowych w 2021 roku.
0
Apr 7

Jak spalić 42 000 dolarów na API albo dlaczego Claude nagle zaczął wyraźnie obniżać jakość pracy

Jeśli w ostatnim czasie masz wrażenie, że Claude Code zaczął wyraźnie działać gorzej, nie jesteś jedyny. Stella Lorenzo, która kieruje obszarem AI w AMD, opublikowała raport, w którym jej zespół przeanalizował 6 852 sesje robocze, aby wykazać, że model stał się na tyle „leniwy”, że nie nadaje się już do powierzania poważnych zadań.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies