AMD Ryzen AI 300: Zen 5, RDNA 3.5 ve XDNA2 ile ilgili muhteşem ayrıntılar

Adanali

Member


  1. AMD Ryzen AI 300: Zen 5, RDNA 3.5 ve XDNA2 ile ilgili muhteşem ayrıntılar

AMD, Los Angeles, Kaliforniya'da gazetecilere ve analistlere yönelik düzenlenen bir etkinlikte, Computex'te duyurulan Ryzen AI 300 dizüstü bilgisayar işlemcileri ve içerdikleri teknolojiler hakkında daha fazla ayrıntı açıkladı.


Duyuru



İki yeni Ryzen AI 9 HX 370 ve Ryzen AI 9 365 CPU'nun temel verileri zaten Computex tarafından biliniyor ancak şimdi daha fazla ayrıntıyla destekleniyor.

AMD, Techday'de ayrıca Computex'te duyurulan Ryzen AI 300 işlemcili Acer, Asus, HP ve MSI marka Copilot+ dizüstü bilgisayarlarını da sergiledi. Çeşitli demo uygulamalarında, özellikle de artık görev yöneticisinde yük göstergesiyle NPU'lar olarak görünen AI birimleri neler yapabileceklerini gösterdi. Asus'un StoryCube, Acer'ın Live Art'ı, MSI'nın LMStudio'su ve HP'nin AI Companion'ı gibi dizüstü bilgisayar üreticilerinin AI araçlarına ek olarak, Stable Diffusion XL Turbo görüntü oluşturucu ve Topaz Labs'ın AI destekçisi Detailretter ve Gigapixel 7 görüntü yükseltici de sergilendi. İlginç detay: dGPU'lu oyun dizüstü bilgisayarlarının hiçbirinde Radeon Mobile yoktu.

Zen 5: Merkezi Kombinasyon


AMD, önceki nesilde Zen'in iki farklı çekirdek versiyonunu (Zen 4 + Zen 4c) zaten geliştirmişti; bunlar, Intel'in performans ve verimlilik çekirdeklerinin aksine, aynı talimat setine sahiptir ve bu nedenle eşit şekilde kontrol edilebilir.

Bunlar başlangıçta Epyc 9704 (“Bergamo”) sunucu işlemcilerinde kullanıldı ve orijinallerinden çok daha kompakttır; dolayısıyla “Kompakt” ve “Klasik” çekirdek adları budur. Teknik olarak kompakt çekirdekler, voltaj-frekans eğrisi üzerinde farklı bir çalışma aralığı için optimize edilmiştir ve bunların etkileşimi aynı zamanda verimlilikle de sonuçlanır. Çalışma voltajı güç kaybının karesi olduğundan, neredeyse her zaman daha düşük bir voltajın performans kaybından daha fazla güç tasarrufuna yol açtığı, yani devrelerin daha verimli çalıştığı varsayılabilir. Artık daha yüksek frekanslar için optimizasyon yapmanız gerekmiyorsa başka yerlerde tasarruf edebilirsiniz ve böylece kompakt çekirdekler klasik versiyonlara göre çok daha az yer kaplar.

Bölünme artık Ryzen 8000G'deki son kullanıcılara da sunuluyor; örneğin Turbo'daki Zen 4c işlemcilerin 5 yerine yalnızca 3,7 GHz'i yönettiği ve dolayısıyla yaklaşık dörtte bir daha yavaş olduğu 8500G'de. Yekpare çipi, daha yüksek saat hızına sahip iki klasik çekirdeği ve daha iyi tepki süresi için dört küçük, kompakt çekirdeği birleştirir.

AMD, Zen 5 çekirdeklerini Ryzen AI 300'de benzer şekilde birleştiriyor: Kalın Zen 5 çekirdeklerinden dördü, sekiz kompakt çekirdekten oluşan paketle birlikte istenen bilgi işlem performansını sağlıyor. Ancak yalnızca en üst seviye Ryzen AI 9 HX 370 modeli tam on iki çekirdeğe sahiptir; Ryzen AI 9 365 (en üst HX modeli eklenmeden) 2+8 konfigürasyonuna razı olmalıdır. Ancak AMD, 300 serisi CPU'larda standart olarak 28 watt olan ve 15 ile 54 watt arasında yapılandırılabilen kompakt çekirdeklerin saat hızlarından bahsetmedi.

Zen 5 mikro mimarisindeki iyileştirmeler, aşağıda açıklandığı gibi AVX512 hariç, büyük ölçüde her iki çekirdek varyant için de geçerlidir.

AMD, ön ucun yanı sıra yürütme birimleri ve önbellek bağlantısını da önemli ölçüde yeniden tasarladı. Artık bir yerine iki bağımsız kod çözücü, dört talimatı paralel olarak işliyor; her biri, halihazırda kodu çözülmüş 6.000 talimat içeren kendi mikro işlem önbelleğine sahip. L1 veri önbelleği %50 artarak 48 Kbyte'a (ilişkisel olarak 12 kat) ulaşır ancak gecikme kötüleşmez. L1 önbelleğinden vektör sürücüsüne giden veri yolu da iki katına çıkarıldı: L1 talimat önbelleği artık iki adet 32 bit okuma bağlantı noktasına sahip, L1 veri önbelleği 64 bit bağlı ve dört okuma işlemini ve iki yazma işlemini doldurabiliyor. AVX512 sürücülerini tam hızda doğru şekilde kullanmak için tüm bunlar yapılır ve kayan nokta kayıtları iki katına çıkarılır. Her zaman olduğu gibi atlama tahminleri de iyileştirilecek ve sıra dışı pencereler genişletilecek. Bu, birden fazla talimatın paralel olarak işlenebileceği ve sürdürülebileceği anlamına gelir.







AMD, Zen 5 mikro mimarisinde bir dizi yeni değişiklik yaptı; örneğin, ön uçta ikili bir getirme/kod çözme hattı kullanılıyor.


(Resim: AMD)



Daha fazla ayrıntı c't'nin gelecek sayısında yer alacaktır.

Tam verim sağlayan AVX512 – teoride


Zen 4'te olduğu gibi AVX512 komut seti uzantısı da yeniden entegre edilmiştir. Zen 4'ün aksine, Zen 5 çekirdekleri teorik olarak AVX512'yi iki yerine tek geçişte çalıştırabilir, böylece saat başına iki kat bilgi işlem gücü sağlar. Ancak AMD, Zen 4'te olduğu gibi yerden ve güçten tasarruf etmek için genel talimatları iki 256 bitlik blokta arka arkaya işleme yeteneğini de korudu.

AMD Ryzen baş geliştiricisi Mike Clark, c't tarafından sorulduğunda “Ryzen'in Vaftiz Babası” olarak onayladığı gibi, her iki Ryzen AI 300 çipinde de tam olarak kullanılan şey budur. Uygun talimatlar geldiğinde AMD'nin klasik ve kompakt çekirdekler arasındaki ayrımı nasıl halledeceğiyle ilgileniyorduk: Sonuçta dört kalın Zen 5 çekirdeği, aynı saat hızında bile sekiz kompakt versiyonla aynı AVX512 performansına sahip olacaktı.

Ancak görünüşe göre bu Ryzen AI 300 için bir sorun değildi çünkü Ryzen AI 300'ün Klasik çekirdekleri, AVX512 işlemlerini art arda iki geçişte işleyerek güç tasarrufu seçeneğiyle çalışıyor. AMD, Klasik çekirdeklerin farklı bir fiziksel maruz kalma maskesi kullanıp kullanmadığını veya tam hızlı AVX512 seçeneğinin yalnızca BIOS veya atmış bir sigorta aracılığıyla etkinleştirilip etkinleştirilmediğini açıklamayı reddetti. Bununla birlikte, dört büyük çekirdeğin 24 MB L3 önbelleğin 16 MB'lık bir bölümüne erişebildiği ve sekiz kompakt çekirdek için yalnızca 8 MB'lık alan bırakacağı bilgisi satırların arasında kayboluyordu.

Ayrıca kompakt Zen 5 çekirdeklerinin yerden tasarrufları hakkında özel bir şey açıklamak istemediler.

Ancak AMD patronu Lisa Su'nun Computex'te yaptığı konuşmada, Ryzen 9000 masaüstü CPU'lar için hızlı AVX512 seçeneğinin kullanılması gerektiğinin altını çizdi.

RDNA 3.5: Dizüstü bilgisayarlar için optimize edildi


AMD'ye göre AMD, Samsung'a lisans verilmesiyle elde edilen deneyime dayanarak Ryzen AI 300'ün entegre grafiklerini güce duyarlı dizüstü bilgisayar sektöründe kullanılmak üzere uyarladı.

En dikkate değer değişikliklerden üçü doku örnekleyicilerin, tamsayıların ve verim karşılaştırmasının iki katına çıkarılmasıdır. Ayrıca, diğer şeylerin yanı sıra bellek alt sisteminin iyileştirilmesi, daha iyi ara belleğe alma yoluyla erişimlerin azaltılması.







Entegre grafikler daha fazla güç verimliliği için yeniden oluşturuldu ve bu nedenle kendi mimari adını aldı: RDNA 3.5. Doku örnekleyici, tamsayı ve karşılaştırma verimi iki katına çıkarılır, bellek erişimi iyileştirilir.


(Resim: AMD)



Doku örnekleyicileri aslında gölgelendirici birimlerindeki veri yollarıdır ve bunlar aynı zamanda AMD'deki doku birimlerinin parçalarını kilitleyen ışın izleme grafik efektleri gibi diğer hesaplamalar için de kullanılabilir. Bunlar daha sonra aynı anda çalışabilir. Hızlandırılmış işlevler genellikle hazırlık görevleri için kullanıldığından, vektör birimlerindeki iki katına çıkan tamsayı ve karşılaştırma verimi, esas olarak diğer bilgi işlem işlemleri için daha fazla zaman bırakır – Nvidia, GeForce RTX 2000 “Turing” serisinde benzer bir değişiklik uyguladı.

15 watt güç tüketimiyle Ryzen AI 9 HX 370, DirectX 12 3DMark Time Spy kıyaslamasında benzer yapılandırılmış Ryzen 7 8840U'ya kıyasla 2462 puanla yaklaşık üçte bir daha yüksek performans elde etmelidir.

XDNA2: Yapay zeka birimi ortadan kaldırıldı


Önceki model gibi yeni yapay zeka birimi de AMD'nin satın aldığı Xilinx FPGA bölümünden, daha doğrusu Versal ürün grubundan geliyor. AMD, Ryzen 8040'a kıyasla performansını yaklaşık üç kata kadar artırdı ve şimdi tamsayı hassasiyetiyle saniyede 50 trilyon işlem (50 TOPS) teorik verime ulaşıyor ve yeni desteklenen FP16 blok formatını kullanırken yalnızca biraz daha düşük. AMD bununla, halihazırda FP16 hassasiyetine sahip olan AI modellerinin XDNA birimleri üzerinden yaklaşık olarak aynı hassasiyetle iki kat daha hızlı çıkarım yapmak istiyor. Bu, yapay zeka modellerinde ek ve karmaşık nicemleme olmadan yaklaşık olarak aynı doğruluğa sahip mantis blokları için ortak bir üs kullanılarak mümkün olmalıdır. Blok FP16'da çeviri için bir araç sağlamak istiyorlar.







XDNA2 AI birimi, AMD'nin Xilinx FPGA bölümündeki Dataflow Versal 2 işlemcilerini temel alıyor. Yapay zeka uygulamaları için bölümlenebilir ve kullanılmayan parçalar uyku moduna geçebilir.


(Resim: AMD)



XDNA2 ünitesi, yapay zeka uygulamalarına ayrı ayrı atanabilen dört yürütme ünitesinden oluşan sekiz gruba sahiptir. Bir konuşmacının eşzamanlı çevirisi veya video filtresi gibi birçok yapay zeka uygulaması için bunun gerçek zamanlı olarak yapılması yeterlidir. Daha yüksek performans kullanıcıya fayda sağlamaz, yalnızca daha fazla elektriğe mal olur; Bu nedenle XDNA2 ünitesi, bahsedilen yürütme birimlerini beş artı bir depolama biriminden oluşan gruplar halinde bir uygulamaya atayabilir. Yapılacak başka bir şey yoksa kalan kullanılmayan sürücüler uyku moduna geçer.

Diğer iyileştirmelerin yanı sıra, yeni XDNA2 sürücüsünün selefi Ryzen 7040'a göre iki kat daha verimli çalışması bekleniyor.





(csp)
 
Üst