>>750
RDNA3にはレジスタアクセスの制限があってゲームでメインに使われるWave32モードでは
2つのALUから同時にはオペランドアクセスが行えず1つずつしか動作できないという話
AMDに問い合わせたところ、それを認めた上でVOPDエンコによる並べ替えやパッキングもあり
レイトレなどでハマれば数%ほど高速化する効果があるという説明
https://www.hardwaretimes.com/amd-rdna-3-vopd-instructions-provide-only-a-4-performance-boost-in-ray-traced-scenes-will-improve-over-time/

つまりWave32による普通のゲームコードだと半分の演算ユニットは寝てるだけ
FLOPSが半分のRDNA2と同程度のゲーム性能しか出てくれない現状は必然
RDNA3.5なり4なりでVGPRのポート設計を修正するまでは状況は大きくは変わらない