Uygulama ile Aç

DeepSeek gerçekten de 6 milyon dolara mı geliştirildi? Görünüşe göre hayır

Günlerdir tüm dünya Çinli yapay zeka girişimi DeepSeek’in yarattığı depremi konuşuyor. Peki DeepSeek’in iddiaları gerçekten de “gerçek” mi? Yoksa ortada büyük bir aldatma mı var?

Çin merkezli yapay zeka girişimi DeepSeek, hafta sonu ABD teknoloji sektöründe adeta bir şok etkisi yarattı. Şirket, OpenAI gibi devlerle rekabet edebilecek büyük dil modeli geliştirdiğini duyurdu. Üstelik bunu yalnızca iki ayda ve 6 milyon dolardan daha az bir bütçeyle başardığını iddia ediyor. Peki bu oldukça etkileyici olan iddialar gerçek mi yoksa ortada büyük bir abartı mı var?

DeepSeek, geliştirdiği yeni R1 modelini (firmanın bir önceki V3 modeli temel alınarak geliştirildi) yalnızca görece az sayıda Nvidia H800 çiplerini kullanarak oluşturduğunu açıkladı. H800 çipleri, ABD'nin ihracat kısıtlamaları doğrultusunda performansı sınırlandırılmış bir ürün olarak biliniyor. Şirket, bu sınırlamalara rağmen Batı’nın en iyi modelleriyle yarışabilecek bir yapay zeka sistemi geliştirdiğini söylüyor. DeepSeek aynı zamanda iddialarını güçlendirmek adına R1 modelinin maliyetini yalnızca 6 milyon dolar olarak belirtti. Bu rakam, OpenAI’ın yeni nesil modelleri için harcadığı tahmini maliyetlerin sadece %3-5’i kadar.

Gerçek olmayacak kadar iddialı mı?

DeepSeek’in iddialarına ilk tepki gösterenlerden biri, yapay zeka alanındaki önemli isimlerden Scale AI CEO'su Alexandr Wang oldu. Wang, DeepSeek’in modeli için ABD ihracat kısıtlamalarını delerek daha güçlü Nvidia H100 çiplerine eriştiğini iddia etti. CNBC’ye konuşan Wang, “Anladığım kadarıyla DeepSeek'in elinde yaklaşık 50.000 adet H100 var. Bu çiplerin varlığını açıkça dile getiremiyorlar, çünkü bu ABD ihracat kontrolüne aykırı olur” dedi.

Elon Musk da Wang’in açıklamalarını sosyal medya platformu X üzerinden yorumlayarak “Kesinlikle” ifadesini kullandı. ABD’li teknoloji analisti Ted Mortonson ise DeepSeek’in H800 çipleriyle bu seviyede bir model geliştirmiş olabileceği iddiasını “abartılı” bulduğunu belirtti.

Yatırım şirketi Atreides Management’ın başındaki isim Gavin Baker, DeepSeek’in maliyet iddialarının yanıltıcı olduğunu savundu. Baker, DeepSeek’in açıkladığı 6 milyon dolarlık maliyetin, önceden yapılan araştırma ve denemeleri kapsamadığını belirtti. Baker, DeepSeek'in teknik belgesinde bu rakamın “mimariler, algoritmalar ve veriler üzerinde yapılan önceki araştırma ve ablasyon deneyleriyle ilgili maliyetleri” içermediğini belirtti.

Reuters'a konuşan uzmanlar da benzer bir söylemde bulunuyor. Araştırma makalesinde bu maliyetin özellikle son eğitim çalışmasındaki çip kullanımına atıfta bulunduğu, tüm geliştirme maliyetine atıfta bulunmadığı belirtildi. Genel olarak AI dünyasında kabul edildiği gibi eğitim çalışması, toplam maliyet açısından buzdağının görünen kısmı. Yapay zekada geliştirmenin önceki aşamalarında daha fazla çip kullanıldığı da bir gerçek.

Maliyet çok mu önemli?

DeepSeek, R1 ve diğer modellerinin eğitimi ve geliştirilme sürecinde tam olarak ne kadar harcadığını açıklamadan bu modellerin maliyetlerini tam olarak bilmemiz mümkün değil. Ancak şunu da sormak gerekiyor; maliyetler bu kadar önemli mi?

Açıkçası elbette herhangi bir ürün için maliyetler oldukça önemli ancak Çin özelinde bunu gözleri kapatarak değerlendirmemek gerek. Bilindiği üzere ABD, Çin’in gelişmiş donanımlara, çiplere ve yarı iletken teknolojilerine erişimini sınırlandırmış durumda. ABD bu sayede Çin’in yapay zekada kendisine yetişmesini sınırlamak istiyor.

Ayrıca bkz.

Nvidia ve OpenAI’dan Çinli DeepSeek açıklaması

DeepSeek’in V3 ve R1 gibi modelleri gösteriyor ki Çin, bir şekilde ABD’nin en ileri yapay zeka şirketi olan OpenAI’ın modelleriyle açıkça rekabet edebilecek ve bazı alanlarda geçebilecek modeller ortaya koyabiliyor. O halde tekrar soralım, maliyetler sizce de o kadar önemli mi? Veya bu seviyeye nasıl ulaşıldığının pek bir önemi var mı?

Burada, maliyetler konusundaki açıklamalarına yer verdiğimiz uzmanların hemen hemen hepsinin DeepSeek’in ilerlemesinin takdire şayan olduğunu söylediğini de belirtelim. DeepSeek’in en fazla övgü aldığı nokta ise bu modelleri açık kaynak olarak piyasaya sürmüş olması. Bu, yapay zeka dünyası için çok büyük bir hizmet.



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş

Beğenilen Yorumlar

Tümünü Gör
14 Yorumun Tamamını Gör