RDMA/RoCE Düşük Gecikmeli Taşıma ve Sunucu Veriminde Atılım

April 29, 2026

hakkında en son şirket haberleri RDMA/RoCE Düşük Gecikmeli Taşıma ve Sunucu Veriminde Atılım
Arkaplan ve Zorluk: CPU Üst Üstü Ücretler Engellediğinde

Hızla büyüyen bir yapay zeka araştırma laboratuvarı tanıdık bir sorunla mücadele ediyordu: 100GbE altyapıları kablo oranlı bant genişliği sağladı, ancak uygulama gecikmesi inatçı bir şekilde yüksek kaldı.Dağıtılmış eğitim işleri sık sık ağ stresinden muzdarip, ve NVMe-over-Fabrics depolama erişimi öngörülemeyen gecikmeler ekledi. Kök nedeni? Geleneksel TCP/IP yığınları sadece paket işleme için yaklaşık% 30 CPU çekirdekleri tüketti,Gerçek iş yükleri için daha az hesaplama bırakıyorEkip, ana CPU'yu yüklemeden verileri hareket ettirmek için temel bir değişime ihtiyaç duyuyordu.Mellanox (NVIDIA Mellanox) MCX653105A-HDATSunucu NIC.

Çözüm ve Uygulama: MCX653105A-HDAT ile RDMA/RoCE Uygulama

Laboratuvar,MCX653105A-HDATHer biri çift portlu 100GbE bağlantısı ile donatılmış 24 hesaplama düğümünde.MCX653105A-HDAT ConnectX adaptörü PCIe ağ kartı, verilerin çekirdeği atlamasına ve doğrudan bellek bölgeleri arasında hareket etmesine izin veren donanım boşaltılmış RoCE'yi (RDMA over Converged Ethernet) destekler.doğruladıktan sonraMCX653105A-HDAT uyumlusunucular (Supermicro ve Dell PowerEdge), mühendisler en son MLNX_OFED sürücüleri kurdu ve DCQCN tıkanıklık kontrolü ile RoCE'yi etkinleştirdi.MCX653105A-HDAT Ethernet adaptör kartıAğ işleme işlemlerini CPU'dan hemen boşaltarak yazılım masraflarını sıfıra yakın bir oranda düşürdü.

Depolama trafiği için, ekip NVMe isim alanlarını doğrudan RDMA üzerinden haritalandırdı.NVIDIA Mellanox MCX653105A-HDATBilgi hareketini mikro saniyeden az bir gecikme ile işledi, donanım tabanlı yönlendirme ise hesaplama ve depolama akışları arasındaki izole etmeyi sağladı.MCX653105A-HDAT veri sayfası, adaptör 200Gb/s'ye kadar toplu işlem hızını destekler ve pratikte, laboratuvar, tam yük altında tek bir paket bırakmadan port başına 100GbE hattı hızına ulaştı.

Sonuçlar ve Faydalar: Gecikme ve Çözümde Ölçülebilir Kazançlar
  • Son-son gecikmenin %50 azaltılması:MPI ping-pong testleri 2.8μs'den (TCP) 1.4μs'e (RoCE) düştü.
  • CPU kullanımı % 70 azaldı:Ağ yığını işleme tamamen donanıma taşındı, model eğitimi için çekirdekleri serbest bıraktı.
  • Depolama miktarı iki katına çıktı:RDMA üzerinden NVMe-oF, yazılım köprüsünü ortadan kaldırdı ve küçük blok erişimleri için gecikmeyi 10μs'in altına itti.

Ekip aynı zamandaMCX653105A-HDAT özellikleriüretim ortamlarına karşı: PCIe 4.0 x16 arayüzü, çift yuva termal tasarımı ve RoCE tıkanıklık bildirimlerine tam destek.MCX653105A-HDAT fiyatı% % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % %MCX653105A-HDAT satılıyor.yetkili distribütörler aracılığıyla, birden fazla yapılandırma seçeneği buldular (tek portlu, çift portlu, güvenli açılışla veya olmadan).

Metrik Daha önce (TCP) (MCX653105A-HDAT / RoCE) Geliştirme
MPI Ping-Pong Gecikme 2.8 μs 1.4 μs -50%
CPU Kullanımı (Ağ Yığınları) ~30% (8 çekirdek) ~5% (maddeci yüklenmeden) -83%
NVMe-oF Küçük bloklu IOPS 320 bin. 680k. %112
Özet & Görünüm: Düşük Gecikme Altyapısı için Bir Plan

Bu konuşlandırma,NVIDIA Mellanox MCX653105A-HDATHızlı NIC'den daha fazlası, tam bir veri hızlandırma platformudur. Ağ işlemeyi donanıma taşıyarak ve gerçek RDMA/RoCE'yi etkinleştirerek,kuruluşlar forklift yükseltmeleri olmadan CPU bağlı ağdan kurtulabilirİster AI eğitimi, dağıtılmış veritabanları veya hiperkonverje depolama çalıştırmak,MCX653105A-HDAT ConnectX adaptörü PCIe ağ kartıBir sonraki altyapı güncellemesini planlayan ekipler için,MCX653105A-HDAT veri sayfasıveMCX653105A-HDAT özellikleriAdaptör geniş çapta kullanılıyor.MCX653105A-HDAT satılıyor.Bir mühendis şöyle özetledi: "Türkiye'de, yeni bir web sitesi kuruldu ve bu sayede yeni bir web sitesi kuruldu.MCX653105A-HDAT Ethernet adaptör kartı100GbE kumaşımızı bir engelden bir performans çarpanına dönüştürdü".