DeepSeek zirveye çıkarken diğerleri çakıldı
Nasdaq 100 vadeli işlemleri yüzde 2,6 düşerken, S&P 500 vadeli işlemleri yüzde 1,4 geriledi. Nvidia'nın hisseleri yaklaşık yüzde 7 değer kaybederken, Tesla, Amazon ve Meta gibi dev şirketlerin hisseleri Avrupa'da yüzde 2'nin üzerinde düşüş yaşadı. Nvidia tedarikçisi Japon Advantest yüzde 8,5, Tokyo Electron ise yüzde 5 gerileyerek dikkat çekti.
Tüm bunlar yaşanırken DeepSeek ise uygulama mağazalarında birinci sıraya yükseldi ve ChatGPT gibi türevleri geride bıraktı.
Öte yandan DeeepSeek'in arkasındaki küçük Hangzhou girişimi hakkında çok az şey biliniyor. DeepSeek araştırmacıları geçen ay yayınladıkları bir makalede, 10 Ocak'ta piyasaya sürülen DeepSeek-V3 modelinin eğitim için Nvidia'nın H800 çiplerini kullandıklarını ve sadece 6 milyon dolar para harcadıklarını yazmıştı. H800 çipleri başlangıçta ABD'nin Çin'e yönelik çip satış kısıtlamalarını aşmak için üretilmiş, ancak daha sonra tamamen yasaklanmıştı. Meta ve OpenAI'ın yeni modellerinin eğitimi için 100 milyon doların üstünde kaynak gerektiğini de perspektif açısından belirtelim.
Ayrıca yapay zeka yatırımlarıyla öne çıkan SoftBank Group, yüzde 8'in üzerinde değer kaybederek 30 Eylül’den bu yana en büyük günlük düşüşünü yaşadı. Şirket, geçen hafta OpenAI ile birlikte 19 milyar dolarlık bir veri merkezi ortak girişimi olan Stargate'e yatırım yapacağını açıklamıştı. Ancak DeepSeek'in yükselişi, bu tür büyük çaplı yatırımların sürdürülebilirliği konusundaki soru işaretlerini artırdı.
Bir gecede dengeler mi değişti?
Nvidia gibi yapay zeka sektörünün yıldızı olan şirketler, 2024’ün başından bu yana yüzde 196 değer kazandı. Ancak DeepSeek’in düşük maliyetli modeli, sektördeki güç dengelerinin yeniden şekillenebileceğine dair sinyaller veriyor. Bu durum, yapay zekanın sadece pahalı altyapılarla değil, aynı zamanda yenilikçi ve maliyet odaklı çözümlerle de büyüyebileceğini gösteriyor.
Ancak DeepSeek etrafında dönen “abartı kültürüne" körlemesine dalmamak gerekiyor.
DeepSeek V3 modeli ve geçtiğimiz hafta tanıtılan OpenAI’ın “düşünebilen” yapay zeka modeli o1 rakibi DeepSeek R1 modelinin kesinlikle güçlü modeller olduğunu belirtelim. DeepSeek-v3, kıyaslamaya bağlı olarak GPT-4, Claude-3.5-Sonnet ve LLlama-3.1 ile karşılaştırılabilir veya daha iyi performansa sahip. 20 Ocak'ta yayınlanan R1'in ilk testleri ise kimya, matematik ve kodlamadaki belirli görevlerde modelin o1 ile aynı seviyede olduğunu gösteriyor. Firmaya göre R1 modeli V3 modelinin üzerine inşa edilmiş durumda.
DeepSeek, DeepSeek V3’ün eğitim verilerini açıklamadığı için modelin neden ChatGPT olduğunu söylediğini belirlemek zor. Ancak bu durum, modelin GPT-4 tarafından ChatGPT aracılığıyla oluşturulan kamuya açık veriler üzerinde eğitilmiş olabileceğine işaret ediyor olabilir. Eğer durum buysa DeepSeek V3 muhtemelen ChatGPT’nin çıktılarının bir kısmını ezberleyip tekrar ediyor.
Peki bu bir sorun mu? Esasında değil. Yapay zeka modellerini eğitmek için gereken devasa verilerin geçen yıl itibariyle tükendiği biliniyor. Dolayısıyla yapay zekaları eğitirken yapay zekaların verilerini kullanmak giderek kabul edilir bir olgu haline geliyor. Ancak bu, kalitenin (DeepSeek V3’te olduğu gibi) düşebileceği durumlar da doğurabiliyor.
En nihayetinde hem DeepSeek V3 hem de R1, yapay zeka endüstrisinin güçlü bir parçası olarak görülüyor. Buradaki “güçlü” söyleminin birçoğu ise özellikle maliyet etkinliğinden geliyor. Yapay zeka dünyası için bu modeller bir “devrim” değiller ancak ABD’nin Çin’in yapay zeka ilerleyişini engelleme tutumuna büyük bir darbe vurdukları da bir gerçek.
Kaynakça https://www.reuters.com/technology/chinas-deepseek-sets-off-ai-market-rout-2025-01-27/ https://www.nature.com/articles/d41586-025-00229-6 https://api-docs.deepseek.com/news/news250120 Bu haberi, mobil uygulamamızı kullanarak indirip,istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
Böyle bir süspansiyonu gerçekte yapmak imkansız değilse de çok zor. Yoldaki tümsekler sağ sol karşılıklı eşit, bu gerçekçi senaryo değil. solda bir tümsek varken sağda olmayacak şekilde olsa görürüm o süspansiyonu :)