U članku objavljenom u časopisu ,,Nature” kompanija je saopštila da je treniranje modela R1 koštalo nešto manje od 300.000 dolara, kao i da je korišćeno 512 čipova H800 kompanije Nvidia.
Dodaje se da kompanija posejduje i A100 čipove, i da ih je koristila u pripremnim fazama razvoja modela R1.,,Koristili smo A100 GPU modele za eksperimente s manjim modelom, a nakon te faze , R1 je obučen tokom 80 sati na klasteru od 512 čipova H800”, navodi se u saopštenju.
Zvaničnici Sjedinjenih Američkih Država u junu su potvrdili da DeepSeek ima pristup velikim količinama H100 čipova koji su nabavljeni nakon što su SAD uvele kontrolu izvoza čipova u Kinu.
Nvidia je u slično vrijeme saopštila da je DeepSeek koristio legalno stečene H800 čipove, a ne H100.
Preporučeno
Izvršni direktor rivalske američke kompanije OpenAI Sem Altman rekao je 2023. da je osnovna obuka njihovog modela ChatGPT koštala ,,mnogo više od 100 miliona dolara”.