Nvidia Tegra X1 teknik analizi: "Konsol seviyesinde grafik, bu defa gerçek mi oluyor ?"

Erdi Özüağ

İnceleme, Test ve Analiz Editörü

Nvidia Tegra X1 teknik analizi: 'Konsol seviyesinde grafik, bu defa gerçek mi oluyor ?'

Las Vegas'ta düzenlenen CES 2015 yani Tüketici Elektroniği Fuarı'nın bu yılki ilk büyük organizasyonunu Nvidia yaptı ve basın toplantısında mobil cihazlar için geliştirilen yeni nesil Tegra X1 ve akıllı otomobil teknolojileri lanse edildi. Her yıl yeni bir Tegra işlemcisi duyuran Nvidia, K1 adını verdiği güncel çözümünde farklı bir strateji izleyerek işlemci tarafında kendi özelleştirdiği 64-bit Denver mimarisi, grafik tarafında da masaüstü sistemlerdeki Kepler mimarisinin özelleştirilmiş tasarımını bir araya getirmişti. Tegra X1 ise özellikle GPU tarafında farklılık yaratırken, CPU tarafında ise daha muhafazakar bir yapı ile çıkıyor. Hadi gelin şimdi hep birlikte performans canavarı Nvidia Tegra X1'in detaylarına yakından göz atalım.

Tegra X1: 8 çekirdekli 64-bit mobil işlemci

Bazı tablet bilgisayarlarda ve Chrome OS işletim sistemli çeşitli dizüstü bilgisayarlarda kullanılan Nvidia'nın Tegra K1 işlemcisiyle ülke olarak tanışamasak bile, potansiyeli ve neler yapabileceğini yakından biliyoruz. İki farklı versiyonu olan Tegra K1, 4+1 çekirdekli düz ARM Cortex-A15 tasarımına sahip versiyonunun yanı sıra Nvidia mühendisleri tarafından geliştirilen, ARM komut setleri üzerinde özelleştirilmiş detaylara sahip çift çekirdekli 64-bit Denver seçeneğine de sahipti. Yeni nesil Tegra X1'de ise işler değişiyor ve Nvidia, vanilla yani saf ARM tasarımına dönüyor.

ARM big.LITTLE tasarımı çerçevesinde Tegra X1'de 8 çekirdek bulunuyor. Bu çekirdeklerden dördü, yüksek performanslı Cortex-A57 tasarımını, diğer dördü ise enerji verimliliğinin daha fazla ön plana çıktığı Cortex-A53 tasarımını kullanıyor. Yani çekirdek konfigürasyonu itibariyle, frekans bağımsız düşündüğümüzde Nvidia Tegra X1 ve Qualcomm Snapdragon 810 aynı çizgide yer alıyor. Kendi işlemci tasarımlarını geliştiren iki firmanın da, 2015'e standart ARM tasarımını baz alan platformlarla giriş yapmış olması da, sadece tesadüf ile açıklanamayacak bir rastlantı. Muhtemelen ana neden, pazara hızlı bir şekilde giriş yapabilmek çünkü özelleştirilmiş çekirdek tasarımları ciddi bir ar-ge gerektiriyor ve bu da birkaç yıllık zamana yayılabiliyor.

Nvidia'nın Tegra X1 işlemcisinde, yüksek performanslı Cortex-A57 çekirdek kümesi, 2MB büyüklüğünde Seviye 2 ön belliği paylaşıyor. Ayrıca küme içerisindeki her bir çekirdek için 48KB/32KB L1 bellek kapasitesine yer veriliyor. Performansın ikinci planda olduğu Cortex-A53 çekirdeklerinden oluşan küme ise 512KB büyüklüğünde Seviye 2 ön belleğe sahip. Bu çekirdekler için konumlandırılan L1 bellek kapasitesi ise 32KB/32KB. Nvidia bu noktada tam anlamıyla ARM tasarımına sadık kalmış demek te çok doğru değil. Belli noktalarad Nvidia mühendislerinin dokunuşlarını görebiliyoruz. Örneğin farklı tipte çekirdeklerden oluşan iki ana küme, ARM'ın kendi bağlantı teknolojisi yerine Nvidia'nın özel arabağlantı sistemiyle haberleşiyor. Nvidia'nın çözümü bellek koherent bir yapıya sahip olduğu içn güç ve performans kolerasyonlu olumsuzluklar, platformun genel HMP yeteneklerini diğerleri gibi etkilemiyor.

Nvidia'nın açıklamasına göre Tegra X1 işlemcisi, benzer şekilde ARM'ın big.LITTLE tasarımını kullanan Samsung Exynos 5433 işlemcisinden performans / watt değerlendirmesinde aynı güç tüketiminde 1.4 kat daha yüksek performans verebiliyor ya da aynı performans seviyesinde neredeyse yarı yarıya daha az güç tüketiyor. Böylesi bir farkın oluşmasında, çekirdeklerin uyarlanmasından, üretim teknolojisindeki farklılıklara kadar bir dizi etkenin rol oynadığını söyleyebilirim. İşlemci mimarisi standart ARM tasarımına sadık kalsa da, Nvidia sistem seviyesinde elektriksel tasarım noktası üzerinden güç yönetimi yaparak ARM'ın gelişmiş güç alokasyon sürücülerinden ayrılarak daha yüksek verimlilik vaad ediyor ve bu da onu, çekirdek tasarımları standart olsa bile pek çok noktayı özelleştirirerek fark yarattığını gösteriyor.

Çekirdeğin dışına çıktığımız noktalarda da Nvidia'nın ciddi bir gelişim gösterdiğine tanık oluyoruz. Özellikle Tegra K1 ile kıyasladığımızda, 64-bit LPDDR3 bellek yerine artık 64-bit LPDDR4 bellek desteğinin geldiğini görüyoruz. Bellek arayüzündeki bu değişim, bantgenişliğini dramati bir şekilde arttırarak 14.9 GB/saniye seviyesinden alarak 25.6/saniye düzeyine çıkartıyor. JEDEC standartları çerçevesinde çok daha düşük enerji tüketimine sahip olan LPDDR4 belleklerle birlikte artan bangenişliğine karşın buradaki güç verimliliği de %40 düzeyinde artış gösteriyor. Görüntü aktarımında da farklı noktaya zıplayan Tegra X1, bir önceki jenerasyonda 3200 X 2000 piksel çözünürlüğündeki 60Hz desteğini alarak, 3840 X 2160 piksel 60Hz düzeyine yükseltiyor. Yani 4K içeriklerin görüntülenmesi noktasında şu anda Tegra X1'in üzerine platform yok diyebiliriz çünkü yeni platform HDMI 2.0 ve HDCP 2.2 destekleri kapsamında Tegra X1, 4K görüntüleri 60 kare/saniye hızında oynatabilecek, h.265 ve VP9 kodeklerine tam destek sunacak.

Görüntü performansına etki eden bir başka etken olarak ISP yani görüntü sinyal işlemcisi de gelişimden nasibini almış durumda. Tegra K1 ile kıyasladığımızda JPEG sıkıştırma başarımı 5 kat hızlanarak 120MP/saniye'den 600MP/saniye düzeyine yükselmiş durumda. Video işleme ve çözümleme tarafında ise hemen yukarıda bahsettiğimiz h.265 ve VP9 ön plana çıkarken, h.265 için verilen 10-bit renk desteği de dikkatlerden kaçmıyor doğrusu. Yeni kodeklerin yanında var olan h.264 ve VP8 standartları da 60 kare/saniye hızında 4K video oynatabilmek yeteneği ile güncellenmiş. Bir başka önemli nokta ise Tegra X1'in depolama tarafında eMMC 5.1 standardına destek getiriyor olması. eMMC 5.0 gibi ~400MB/saniye+ transfer hızlı depolama sürücüleriyle çalışıyor Tegra X1 ancak "Enhanced Strobe ve Command Queing" gibi bazı yeni özellikler sayesinde cihaz üzerinde NAND kontrolü daha etkin bir noktaya geliyor ve yazma konusunda verimlilik artıyor.

Tegra X1: Maxwell GPU Mimarisi Mobil Cihazlara Geliyor

Nvidia'nın grafik teknolojilerinde ulaştığı en yüksek performans/watt başarımını yansıtan Maxwell mimarisini bir ilk defa GM107 GPU'sunu kullanan GeForce GTX 750 Ti ekran kartı ile görmüşt ve sonrasında devamı çok hızlı gelerek bugün GTX 980'lere kadar geniş bir ürün yelpazesinden bahsediyoruz. Üstelik enerji verimliliği şu an rakipsiz durumda. Nvidia'nın Erista kod adıyla geliştirdiği Tegra X1 platformu da Maxwell GPU tasarımından sebepleniyor. "Mobile First" stratejisine adapte olan Nvidia, Maxwell mimarisini geliştirirken, Tegra platformunun geleceğine dönük tüm gereksinimleri dikkate alarak, daha sonrasında mimariden devşirme bir ultra mobil GPU (daha önceki Tegra platformları gibi) yerine daha modüler, ürün gamındaki tüm platformlarla ahenkli bir mimari geliştirmeye özen gösterdi.

Tegra X1'de kullanılan yeni GPU, Maxwell 2.0 mimarisini kullanıyor. Tegra K1'de Kepler mimarisini sahip 192 CUDA çekirdeği, Tegra X1'in GPU'sunda hem yepyeni bir mimariye sahip hem de sayısı 256'ya yükseltişmiş durumda. Doku ünitesi iki kat artış ile 16 olurken, ROP birimleri de 4 kat artış ile 16'ya tırmanmış. Saat hızının 1GHz seviyesinde olduğu öngörülen GPU, 1600MHz hızında LPDDR4 belleğin sunduğu yüksek bantgenişliğinden istifade ediyor. Böylesi yüksek bir bantgenişliğine 64-bit arayüz ile bağlanan GPU, FP16 tek hassasiyette 1 TeraFLOP, FP32 tek hassasiyette ise 512 GigaFLOP seviyesinde teorik hesaplama gücü sunuyor. Teknik seviyedeki geliştirmeler sayesinde Tegra K1'in grafik performansıyla kıyaslandığında Tegra X1 iki kat daha yüksek performans ve aynı zamanda 2 kat daha iyi watt başına performans sunuyor. Performans bu kadar artarken, güç tüketiminin düşürülmesi, GPU tasarımındaki gelişmelerin yanında üretim sürecinin de 28nm seviyesinden 20nm'ye sıçramasının payı da büyük.

Nvidia, Tegra X1'in grafik işlem birimini ele alırken, belli noktalara özellikle hassasiyet göstermiş. Mobil cihazlarda kullanılan SoC yani yongada sistem platformu dediğimiz uygulama işlemcileri için performans darboğazı yaratan temel unsur, bellek bantgenişliğine ilişkin problemler. Masaüstü ekran kartları için geliştirilen GPU'larda, bantgenişliği sorunu 512-bit'e varan geniş arayüzler ile aşılabilirken, küçücük pakette yer alan bir GPU için bu pek mümkün değil. Zira bu hem zar alanını büyütüyor hem maliyeti arttıyor hem de üretimi daha karmaşık bir hala getiriyor ki, böylesi gelişmeler mobil işlemci sürecinde istenmeyen durumlardır. LPDDR4 bellek kullanımının kuşkusuz bu sorunu çözme noktasında belli etkileri var ancak Nvidia, 64-bit arayüze sadık kalırken, diğer taraftan yepyeni algoritmalar üzerinden yenilikçi bellek sıkıştırma teknolojileri uyguluyor ve durum darboğaz yaşanmadan ve güç tüketiminde ciddi bir artış olmadan, yüksek detay ve çözünürlüklerdeki darboğaz sorununu aşar gibi görünüyor.

Tegra X1 işlemcisindeki yeni nesil GPU için Nvidia'nın yaptığı özelleştirmelerden biri de 16-bit kayar nokta hesaplamaları üzerine. Fermi mimarisinden bu zaman kadar Nvidia'nın tüm GPU tasarımları 32-bit ve 64-bit kayar nokta donanımına sahipti. Benzer şey Maxwell mimarisi ve dolayısıyla Tegra X1'in grafik işlemcisi için de geçerli ama bir önemli farkla. Tegra X1'in GPU'su, iş yükünü FP32 ünitelerinde FP16 olarak hesaplayabiliyor. FP16 önemli çünkü özellikle güç verimliliğine ciddi etki ediyor ve bu durum da performansa da dolaylı yoldan yansıyor. Artan güç tüketimi platformun ısınmasına dolayısıyla koruma modunu devreye sokarak agresif saat hızlarında gerileme yaşanarak performans düşüşlerine vesile oluyor. FP16 ALU'lar, FP32 ve üstü tasarımlara kıyasla mantık biriminin karmaşıklığını azaltması ve FP16 komut gruplarını FP32'lerden daha düşük güç tüketimiyle uygulayabilmesi sayesinde daha fazla iş üretiyor çünkü döngü başına üstlenebildiği operasyon miktarını arttırabiliyor. Tabi bu durumun yaşanabilmesi için mimarinin çok sayıda 16-bit operasyonunu birbiriyle zamanlayabilmesi gerekiyor.

16-Bit kaya nokta hesaplamalarının SoC sınıfı grafik işlem birimlerindeki en büyük destekçilerinden olan Imagination, Apple'ın A8 serisinde de kullanılan PowerVR 6 serisi GPU'larda model ve konfigürasyona göre değişen sayıda ALU kullanmakla birlikte, mimarinin temel karakteristiği gereği FP32 ALU'larda aynı döngüde 2 kayar nokta hesaplaması yapabilirken, FP16 APU'larda ise aynı döngüdeki kayar nokta operasyonu 4'e kadar çıkabiliyor, daha somut bir örnek vermek gerekirse PowerVR GX6650 grafik birimi, 6 unified shader kümesi içerisinde her döngüde 384 FLOP kayar nokta hesaplama gücü sunabilen 192 FP32 ALU'su ve her döngüde 786 FLOP sunabilen 384 FP16 ALU'suna sahip. 600MHz çalışma frekansını baz aldığımızda, aynı GPU'sunun 460 GFLOP FP16 ve 230 GFLOP FP32 işlem gücü sunabildiği ortaya çıkıyor. İşin ilginç olan yanı ise, geleneksel olarak bakıldığında SoC tasarımlarında çekirdek sayısı olarak işlemci içerisimdeki front-end dediğimiz, uygulanacak izlekin beklemekte olan işlemi alıp işlemciye yollayan ve ne kadar kalacağına karar veren zamanlama algoritmalarından sorumlu birimin sayısı ile ölçülüyordu. Ancak günümüzde agresif pazarlama faaliyetlerinin bir sonucu olarak üreticiler artık ALU sayısını da çekirdek olarak anlatıyor.

Tegra X1'in GPU'suna geri dönecek olursak eğer, geliştirilen FP16 metodu doğal FP16 kaynaklarına sahip olan tasarımlar kadar güç verimliliği sunmayacak belki ama SoC için bu durumun farkına varılarak bir takım özelleştirmelerin yapılmış olması önemli bir adım. Mobil cihazlarda FP16 operasyonlarının bu derece önemli olmasının sebbei ise düşük hassasiyetli bazı basit işlerin Android çatısı altında daha yüksek enerji verimliliği için FP16 kullanılarak yapılması. Ayrıca kimi oyunlar da yine FP16'dan istifade eden yazılımlar arasında.

Tegra X1'in GPU Performansı ve Güç Tüketimi

Nvidia Tegra X1'in referans platformu olan bazı özel kurulumlar lansman sonrasında gazetecilere test ettirildi. Burada dikkat çeken nokta, Tegra X1 üzerinde özel bir pasif soğutucunun bulunmasıydı. Buradaki amaç, olağan tablet bilgisayarların 5 Watt'lık termal tasarımını yakalayabilmek. Yapılan deneylerin gösterdiği üzere Nvidia'nın Tegra X1 için tasarım çalışmaları tamamlanmış ve hazırlanan üretim örnekleri de başarılı bir şekilde testleri tamamlayabiliyor. Performans noktasında ise Nvidia, Apple ve iPad Air 2'deki A8X işlemcisini hedef alıyor.

Yapılan testler Nvidia'nın belli kontrolleri altında gerçekleşmiş olsa bile ortaya çıkan sonuçlar Nvidia adına heyecan verici diyebilirim. Basemark X 1.1, 3DMark 1.2 Unlimited ve GFXBench 3.0 üzerinde yapılan testlere göre Tegra X1 selefi olan Tegra K1'in GPU'suna GFXBench testinde 2 kat fark atarken, Basemark ve 3DMark'ta ise fark %56 ve %59 seviyelerinde ölçülmüş. Tabi bu testlerin mühendislik örneği sistemlerde yapıldığını ve zamanla sürücülerin daha da olgunlaşacağını düşündüğümüzde aradaki fark açılabilir de. Apple tarafında iPad Air 2 ve A8X işlemcisi ile kıyaslandığında farklı bir tablodan bahsedebiliriz. Ortaya çıkan ölçüm sonuçlarına göre Tegra X1, aynı performans seviyesinde A8X işlemcisinden daha az güç tüketirken, aynı güç tüketim seviyesinde ise çok daha fazla performans veriyor.

Bunu kanıtlamak için Nvidia, Tegra X1 işlemcisinin saat hızını düşürerek A8X işlemcisiyle aynı performans seviyesine getirerek çalıştırdı. Manhattan 1080p (offscreen) testinde iki platform da 30 kare/saniye civarında performans gösterirken yapılan ölçümlerde ki burada toplam cihaz güç tüketiminden değil sadece GPU'nun kullandığı güç miktarından bahsediyoruz; Apple A8X işlemcisi 2.5 Watt iken, Nvidia Tegra X1 ise 1.6 Watt düzeyinde idi. Merak edenler için her iki platformun da 20nm üretim geometresine sahip olduğunu bu noktada hatırlatmış olayım. Açık konuşmak gerekirse Tegra K1 ile kıyaslandığında Nvidia'nın kaydadeğer biçimde dikkat çekici bir gelişim gösterdiğini söyleyebilirim. Ancak lansman döneminde yine çok iddialı olan Tegra K1 platformunu dünya genelinde görememiştik umarız bu defa işler değişir ve Tegra X1'li sistemlerle tanışma şansı yakalarız. Nvidia GPU mühendisliğinin en başarılı örneklerinden olan Maxwell mimarisine sahip yeni GPU'su ve tam olmasa da özelleştirilmiş detaylarla dolu işlemci tasarımıyla Tegra X1, 2015 için çok fazla konuşulacak, tartışılacak gibi görünüyor.

Lansman esnasında Nvidia, Tegra X1'i kullanan herhangi bir ürün duyurmadı. Firma yetkilileri yeni işlemcinin üretimde olduğu ve iş ortaklarına örneklemenin başladığını ifade ederken, ilk cihazların ne zaman çıkacağı konusunda net bir tarih vermiyor sadece 2015 içerisinde diyorlar. Eğer Nvidia tarafı olumsuz yönde bir sürpriz yapmaz ise Tegra X1'li ilk cihazların şirketin kendi ürünü olan Shield 2 oyun konsolu ve Shield Tablet 2 olmasını bekleyebiliriz. Konsol seviyesinde grafik sunan mobil işlemci argümanının belki de şu ana kadar ki en büyük destekçisi olan Tegra X1'e karşı bakalım Apple'ın A9 ve diğer işlemci modelleri nasıl bir yol izleyecekler. Yukarıdaki mimari özelliklerden kafası karışanlar için temel özellikler sıralamak gerekirse;

- TSMC tarafında 20nm düzlemsel üretim geometresi (Apple A8 serisi ile aynı)

- ARM big.LITTLE Tasarımı

- Çekirdekler: 4x ARM Cortex-A57 + 4x ARM Cortex-A53

- 64-Bit, iki çekirdek kümesi için Nvdia özel bağlantı teknolojisi

- A57 çekrdekleri için 2MB ortak L2, A53 çekirdekleri içinse 512KB ortak L2

- LPDDR4 bellek desteği ve 64-bit bellek kontrolcüsü

- Maxwell 2.0 mimarili yepyeni GPU Tasarımı

* Çift SM

* 256 CUDA Çekirdeği

* 1 TeraFLOP FP16, 512 GigaFLOP FP32 işlem gücü

* 16 doku ünitesi ve 16 ROP birimi

* 1600MHz bellek hızı ve 25.6GB/sn bantgenişliği

* GPU için L2: 256KB.
* API seviyesinde DirectX 12, OpenGL ES 3.2, OpenGL 4.5, CUDA desteği

- TDP değeri: 10 Watt.

Sektör Uzmanları ve Analistler Ne Dedi?

- Linley Gwennap, Linley Group Kurucu ve Baş Analisti: " Tegra X1, ilk TeraFLOP seviyesi süper bilgisayarı geçebilecek güce sahip. Geliştiricilerin bununla neler yapabileceğini hayal edin."

- Jon Peddie, Jon Peddie Research Başkanı: " Tegra X1, bir mobil işlemcinin ne kadar yetenekli olabileceği konusunda beklentileri yukarı taşıyor. Sahip olduğu işlem gücü akıllara durgunluk verecek türden."

- Tim Bajarin, Creative Strategies, Inc. Başkanı: " Tegra X1 inanılmaz. Sadece bir yıl önce lanse edilen Tegra K1 ile aralarında uçurum var. Bu yıl otomotiv, tablet, gömülü sistem ve mobil oyun pazarlarında itici güç olacak."

- Pat Moorhead, Moor Insights and Strategy Kurucu ve Baş Analisti: "Nvidia'nın sadece birkaç ay içerisinde GTX 980 ekran kartındaki Maxwell mimarisini Tegra'ya getirebilmesi baş döndürücü."

Foto Galeri

(15)

Aç

Yorum Yaz Paylaş Tweetle

Bu haberi, mobil uygulamamızı kullanarak indirip,
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:

Daha Fazla Video

donanimhabercom Instagram Takip Et

Yeni Audi A6 resmen tanıtıldı: Şık ve sportif

Nvidia Tegra X1 teknik analizi: "Konsol seviyesinde grafik, bu defa gerçek mi oluyor ?"

Foto Galeri

Forumdan Konular

Editörün Seçtiği Sıcak Fırsatlar

Sıcak Fırsatlar Forumunda Tıklananlar

Tavsiyelerimiz