[NEW] Search for a job anonymously — check the details
Close
DeepSeek wydało ponad 1,6 mld dolarów na szkolenie AI, a nie 6 mln

DeepSeek wydało ponad 1,6 mld dolarów na szkolenie AI, a nie 6 mln

Chiński startup AI DeepSeek zainwestował około 1,6 miliarda dolarów w szkolenie swojej zaawansowanej modeli językowej R1, mimo że wcześniejsze doniesienia sugerowały znacznie niższy budżet wynoszący 6 milionów dolarów – wynika z raportu SemiAnalysis.

Koszt trenowania DeepSeek-R1 stał się kluczowym tematem wokół tego startupu, ponieważ jego twórcom udało się osiągnąć poziom zbliżony do OpenAI przy znacznie niższych nakładach finansowych. Według analityków SemiAnalysis, DeepSeek korzysta obecnie z około 50 tysięcy układów Hopper od NVIDIA i oczekuje na dostawę kolejnych 10 tysięcy.

Wykorzystanie chipów w obliczu ograniczeń eksportowych USA

Z powodu amerykańskich ograniczeń eksportowych, DeepSeek nie może swobodnie korzystać z najlepszych chipów AI. Dlatego oprócz H100, które do premiery Blackwell były uznawane za najlepsze w branży, firma używa także H800, H20 (specjalnie dostosowanych do chińskiego rynku) oraz A100.

https://semianalysis.com/2025/01/31/deepseek-debates/
https://semianalysis.com/2025/01/31/deepseek-debates/

Obecnie najwięcej w infrastrukturze DeepSeek stanowią H20 – około 30 tysięcy sztuk wraz z dodatkowymi zamówieniami. Dodatkowo firma posiada po 10 tysięcy jednostek H100, H800 i A100, co pozwala na budowę potężnej infrastruktury obliczeniowej.

Realne inwestycje DeepSeek w infrastrukturę serwerową

Według raportu SemiAnalysis, całkowite inwestycje DeepSeek w serwery wynoszą około 1,6 miliarda dolarów, z czego około 944 miliony dolarów zostały przeznaczone na bieżące potrzeby operacyjne.

Analitycy podkreślają, że wcześniej podawana kwota 6 milionów dolarów dotyczyła jedynie kosztów wstępnego szkolenia modelu V3 i była niewielką częścią całkowitych wydatków. Suma ta obejmowała jedynie nakłady na procesory wykorzystane do pierwszej fazy trenowania.

Konkurencja i obawy dotyczące bezpieczeństwa

Mimo że rzeczywiste koszty szkolenia chińskiego modelu okazały się znacznie wyższe, niż pierwotnie zakładano, producenci chipów oraz inne podmioty z branży AI z optymizmem patrzą na pojawienie się nowego konkurenta.

Jednak chińskie pochodzenie DeepSeek oraz ostatni wyciek danych budzą pewne obawy. Z tego względu Marynarka Wojenna USA, Kongres, Pentagon oraz setki firm na całym świecie ograniczają dostęp swoich pracowników do technologii DeepSeek, obawiając się potencjalnych zagrożeń dla bezpieczeństwa.

Czy uważacie, że DeepSeek może stać się realnym konkurentem dla OpenAI, mimo ograniczeń eksportowych?

Avatar
May 30

Angular v20: stabilizacja reactivity, nowe API i pożegnanie ze strukturalnymi dyrektywami

Zespół Angular ogłosił premierę wersji 20, skupiając się na stabilizacji istniejących funkcji, wsparciu dla GenAI, usprawnieniu debugowania oraz dalszym odchodzeniu od Zone.js. Wśród najważniejszych zmian znalazły się nowe eksperymentalne API, rozbudowane wsparcie dla renderowania po stronie serwera oraz aktualizacje stylu i diagnostyki, – informuje Angular Blog.
0
Jun 24

Iran publikuje fałszywe nagrania zestrzeleń izraelskich myśliwców, wykorzystując ujęcia z Arma 3 i innej gry

Od 13 czerwca na Bliskim Wschodzie trwa wojna między Izraelem a Iranem. Po tym, jak państwo żydowskie przeprowadziło serię skutecznych ataków, rząd ajatollahów zaczął odpowiadać atakami rakietowymi. Gry komputerowe stały się jednym z narzędzi propagandy w tym konflikcie. Irańskie wojsko wykorzystało ujęcia z Arma 3 oraz rosyjskiej gry War Thunder, aby zaprezentować sfabrykowane zestrzelenia izraelskich samolotów. Nagrania te były intensywnie rozpowszechniane w mediach społecznościowych.
0
Mar 20

Google przejmuje Wiz za 32 mld dolarów – największa transakcja w historii firmy

Google ogłosiło zawarcie umowy na przejęcie Wiz, amerykańskiego startupu zajmującego się cyberbezpieczeństwem chmurowym. Wartość transakcji wyniesie 32 miliardy dolarów i zostanie w całości sfinalizowana w gotówce. Po zamknięciu transakcji Wiz stanie się częścią Google Cloud, co umożliwi dalszy rozwój technologii zabezpieczeń chmurowych oraz rozwiązań multicloud – podejścia pozwalającego organizacjom korzystać z wielu różnych dostawców chmury jednocześnie.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies