İmagenet sitesinde yer alan büyük fotoğraf verisini kullanılarak yapılan testlerde sistemlerden gördükleri fotoğrafları tahmin etmeleri isteniyor. Google'ın "deep learning" teknolojisi %6.6 hata payı ile fotoğrafta gördüklerini doğru tahmin ederken Baidu bu hata payını %5.98'e çekiyor. Normal bir insan bilgisayarın karşısına geçtiğinde ise %5.1'lik hata ile gördüğü fotoğrafları tahmin ederken Microsoft ilk defa bu hata oranını insandan daha düşük bir seviyeye %4.94'e kadar indirmeyi başardı.
Sitemin her zaman insan tahminlerinin altında kalamadığı söyleniyor ancak bir ilk olarak insan tahminlerinin önünde yer alabilen bu teknoloji dikkat çekmeyi başarıyor.
Aşağıdaki fotoğrafta tahminlerin bir örneğini görebilirsiniz, paylaşılan bu fotoğrafta "deep learning" teknolojilerinin en çok hata yaptığı fotoğraflar gösteriliyor. Tahminlere bakılırsa sistemler objeleri doğru olarak ayırt edebiliyor fakat bu tarz fotoğraflarda bütünü tahmin etmekte zorlanıyor.
GT doğru cevabı temsil ederken altındaki sıralamalar ise teknolojilerin en popüler tahminlerini gösteriyor.
GT doğru cevabı temsil ederken altındaki sıralamalar ise teknolojilerin en popüler tahminlerini gösteriyor.
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz: