DeepSeek, biyolojik silah güvenliğinde sınıfta kalıyor
Anthropic CEO'su Dario Amodei, DeepSeek'in yürütülen bir güvenlik testinde biyolojik silahlar hakkında nadir bilgiler ürettiğini söyledi: “Şimdiye kadar test ettiğimiz modeller arasında en kötüsü.”
Tam Boyutta GörAnthropic CEO'su Dario Amodei, Çinli rakibi DeepSeek'in büyük etki yaratan R1 modelini biyolojik silah güvenliği konusunda test ettiklerini ve modelin "en kötü" performansı gösterdiğini belirtti. Amodei'nin endişeleri, DeepSeek'in kullanıcı verilerini Çin'e göndermesiyle ilgili endişelerden çok daha ciddi görünüyor.
Biyolojik silah tehlikesi
Amodei, DeepSeek'in, Anthropic tarafından yapılan bir güvenlik testinde biyolojik silahlarla ilgili nadir bilgiler ürettiğini belirtti: “Şimdiye kadar test ettiğimiz modeller arasında en kötüsü. Bu bilgiyi üretmeye karşı kesinlikle hiçbir engeli yoktu.” Amodei, Anthropic’in çeşitli yapay zeka modellerini düzenli olarak ulusal güvenlik risklerini değerlendirmek amacıyla test ettiğini söyledi. Bu testlerde, modellerin Google’da veya ders kitaplarında kolayca bulunmayan biyolojik silahlarla ilgili bilgileri üretip üretmediği kontrol ediliyor.
Amodei, DeepSeek'in modellerinin bugün nadir ve tehlikeli bilgiler sağlama konusunda “tam anlamıyla tehlikeli” olduğunu düşünmediğini, ancak yakın gelecekte olabileceğini söyledi. DeepSeek'in ekibini “yetenekli mühendisler” olarak övmesine rağmen, şirkete “bu yapay zeka güvenlik hususlarını ciddiye almalarını” tavsiye etti.
Tam Boyutta GörDeepSeek'in yükselmesi, başka güvenlik endişelerini de beraberinde getirmiş durumda. Cisco güvenlik araştırmacıları, geçtiğimiz hafta DeepSeek R1'in güvenlik testlerinde zararlı komutları engellemekte başarısız olduğunu, yüzde 100 jailbreak başarısı sağladığını bildirdi. Cisco, biyolojik silahlar hakkında bir açıklama yapmasa da, DeepSeek'in siber suçlar ve diğer yasa dışı faaliyetlerle ilgili zararlı bilgiler ürettiğini belirtti. Ancak, Meta’nın Llama-3.1-405B ve OpenAI’ın GPT-4’ünün de sırasıyla %96 ve %86'lık yüksek başarısızlık oranlarına sahip olduğu unutulmamalı.