Deepseek'in Elinde Sadece NVIDIA H800 ve H20'ler Değil, H100'ler de Var
Ne var ki günler geçip Deepseek R1 daha detaylı olarak mercek altına alındıkça bunun tam olarak böyle olmadığı ortaya çıktı. Deepseek gerçekten Batılı rakiplerinden çok daha düşük bir maliyete ve çok daha kısıtlı bir donanımla bu yapay zekayı geliştirmişti ama elindeki donanım söylediğinden biraz daha iyiydi. Ortaya koyulan işçiliği inceleyen ve Çinli meslektaşlarıyla konuşan analistler, Deepseek'in ABD tarafından uygulanan ambargoya rağmen bir şekilde Nvidia'nın en güçlü GPU'larına eriştiğini ve yapay zekasını bunlarla eğittiğini söylüyorlar. Şirket, yasal yaptırımlarla karşılaşmamak için bu "ufak" detayı açıklamamayı tercih etmişti.
Yapay zeka alanında önde gelen analistler arasında yer alan Dylan Patel ve Nathan Lambert, bu hafta katıldıkları bir podcast'te bu konu hakkında görüşlerini paylaştılar.
Deepseek'in Nvidia'nın Çin'deki en büyük müşterilerinden biri olduğuna dikkat çeken Dylan Patel, şirketin H800 ve H20'lerin yanı sıra H100'lere de sahip olduğunu, R1 modelini geliştirirken az sayıda da olsa H100 kullandığını söylüyor. Bu da böyle bir yapay zekanın bu kadar kısa sürede nasıl geliştirildiğini daha iyi açıklıyor.
Aslında ABD'nin yapay zeka çiplerine getirdiği kısıtlamalar Nvidia'nın en güçlü GPU'ları olan H100 ve H200'leri Çinli şirketlere satılmasını yasaklıyor. Fakat Patel, Deepseek gibi şirketlerin ambargoya rağmen bu GPU'lara bir şekilde ulaştıklarını belirtiyor.
Çinli Şirketler Satın Alamadıkları GPU'ları Bulut Hizmeti Veren Şirketlerden Kiralıyorlar
Çinli şirketlerin GPU'lara ulaşmasının bir diğer yolu taşaron şirketler ve komşu ülkeler üzerinden bu GPU'ları alıp Çin'e aktarmaktan geçiyor. Patel, kendisi veri merkezi kurmadığı hâlde Nvidia'dan en çok GPU alan ikinci ülke olan (ilki ABD) Singapur'un bu GPU'ların önemli bir kısmını Çin'e aktarıyor olabileceğini ima ediyor.
Yapay zeka dünyasında bu hafta: 8 Şubat 2025
Tabii tüm bunlar bir ay öncesine kadardı. Joe Biden görevden ayrılmadan hemen önce AI çiplerinin yurt dışına satılmasına çok daha ağır kısıtlamalar getiren bir kararname imzaladı. Donald Trump döneminde de yürürlükte kalması beklenen bu yeni düzenleme, Amerikalı şirketlerin GPU'ları bulut servisleri üzerinden yurt dışına kiralamasına önemli sınırlamalar getiriyor. Özellikle Çinli şirketlere kiralamaları bu yeni düzenlemeyle birlikte neredeyse imkânsız hâle gelmiş durumda. Bu yüzden ByteDance ve Deepseek gibi şirketlerin önümüzdeki dönemde GPU kaynaklarına erişimi çok daha kısıtlanmış olacak. Çünkü aynı şekilde Singapur ve Malezya gibi Asya ülkeleri üzerinden GPU temin etmeleri de epey zorlaşacak.
Çinli Şirketlerin GPU'lara Erişimi İyice Zorlaştığı İçin Bir Sonraki AI Jenerasyonunda Geride Kalabilirler
Çinli şirketlerin GPU'lara erişiminin önemli ölçüde kısıtlanmış olması, ByteDance ve Deepseek gibi şirketlerin Batılı rakipleriyle rekabet etme potansiyeline dair bir soru işareti yaratıyor. Çünkü Patel'in de belirttiği gibi Çinli şirketler ne yapıp edip bir şekilde bu GPU'lara erişmeye devam edecekler ama bir noktadan sonra kaçak yollarla elde edilen bu GPU'ların miktarı Batılı rakipleriyle yarışmaları için yetersiz kalmaya başlayacak. Patel, GPT-4o gibi mevcut modellerde bunun sorun olmadığını, belki bir sonraki AI jenerasyonunda da olmayacağını ama bir kaç jenerasyon sonra GPU eksikliğinin belirleyici olmaya başlayacağını düşünüyor.
Patel'e göre Çinli şirketler hem daha gelişmiş yapay zekaları eğitmekte, hem de bunları kullanıcıları sunmakta sorun yaşayacak. Özellikle bu yapay zekaları internet üzerinden kullanıma sunma kısmında Çinli şirketler büyük sorun yaşayabilir. Nitekim Deepseek'in daha şimdiden kapasite sorunu yaşadığını görüyoruz. Şirket yoğun talep sebebiyle kesintisiz hizmet vermekte zorluk çekiyor. Daha gelişmiş yapay zekaları kullanıcıların kullanımına açmak daha fazla GPU gücü gerektireceği için, Çinli şirketlerin bunu karşılaması gitgide daha zor hâle gelecek. Çünkü söz konusu yapay zeka olduğunda Jevons Paradoksunun prensipleri devreye giriyor. Her ne kadar teknolojik gelişimle birlikte verimlilik artıyor olsa da (Deepseek R1'de olduğu gibi), bununla birlikte toplam tüketim de arttığı için enerji tüketimi de artıyor. Yani Deepseek gibi şirketler R1 modelinde olduğu gibi yapay zekayı daha verimli şekilde kullanmanın yollarını geliştirseler bile buna düz orantılı olarak kullanım da artacağı için her şekilde daha fazla güce ihtiyaçları olacak. Ama bunu karşılayacak GPU'lara erişimleri her geçen gün biraz daha kısıtlandığı için, er ya da geç ellerindeki kaynaklar yetersiz gelmeye başlayacak. En azından mevcut analizler bunu söylüyor. Elbette yapay zeka gibi her gün hızla değişen bir alanda üç dört yıl ilerisine dair kesin şeyler söylemek mümkün değil. Ancak bugünden bakıldığında, GPU engeli yakın bir gelecekte Çin'in ayağına takılacak gibi görünüyor.
Haberi DH'de Gör
{{body}}
{{/longBody}} {{^longBody}}{{body}}
{{/longBody}}