NVIDIA Mellanox MCX653106A-HDAT Teknik Çözüm: RDMA/RoCE Tabanlı Düşük Gecikmeli Aktarım ve Sunucu

June 16, 2026

NVIDIA Mellanox MCX653106A-HDAT Teknik Çözüm: RDMA/RoCE Tabanlı Düşük Gecikmeli Aktarım ve Sunucu

Bu teknik beyaz kitap ağ mimarları, satış öncesi mühendisler ve operasyon yöneticileri için tasarlanmıştır.NVIDIA Mellanox MCX653106A-HDATsunucu adaptörü ve mikrosaniye ölçeğinde RDMA / RoCE taşımacılığı ve ultra yüksek işlem performansına sahip bir veri merkezi ağ altyapısı nasıl inşa edileceğini açıklar.

1. Arka plan ve Gereksinimler Analizi

Modern veri merkezleri üç temel zorlukla karşı karşıyadır: dağıtılmış depolama alanlarında öngörülemeyen gecikme, yapay zeka eğitim kümelerinde bant genişliği açlığı,ve geleneksel ağ protokol yığınları tarafından aşırı CPU tüketimiGeleneksel TCP/IP çözümleri artık NVMe-oF, yüksek frekanslı ticaret ve gerçek zamanlı analitiklerin mikrosaniye ölçekli gecikme taleplerini karşılayamaz.MCX653106A-HDAT Ethernet adaptör kart çözümüBu, standart Ethernet altyapısı üzerinden donanım boşaltılmış RDMA taşımacılığını sağlayan ve aynı zamanda sunucu verimliliğini 200Gbps seviyesine kadar ölçeklendiren.

2Genel Ağ/Sistem Mimarlığı Tasarımı

Bu çözüm, iki katmanlı bir Leaf-Spine CLOS mimarisini benimsiyor.NVIDIA Mellanox MCX653106A-HDATAna tasarım ilkeleri şunlardır:

  • PFC (Öncelik Akış Kontrolü) ve ECN (Açık tıkanıklık bildirimi) ile etkinleştirilen uçtan sona kayıpsız ağ
  • Depolama ve HPC iş yükleri için özel RDMA taşıma yolları
  • Kontrol düzleminin (standart TCP/IP) ve veri düzleminin (RoCEv2) ayrılması
  • Donanım tabanlı sanallaştırma yükleri (SR-IOV, VXLAN/NVGRE/Jeneve)

Bu konuyaMCX653106A-HDAT veri sayfası, adaptör 600ns altındaki port-to-port gecikme sağlar ve saniyede 215 milyona kadar paketi destekler, bu da hem Doğu-Batı depolama trafiği hem de Kuzey-Güney uygulama akışları için idealdir.

3Bu Çözümde NVIDIA Mellanox MCX653106A-HDAT'ın Rolü ve Anahtar Özellikleri

BuMCX653106A-HDAT ConnectX adaptörü PCIe ağ kartıTemel veri uçağı motoru olarak hizmet eder.

  • RDMA/RoCE Hızlandırma:RoCEv2'nin tıkanıklık yönetimi, sıra dışı paket işleme ve uygulama tamponlarına anında veri yerleştirme de dahil olmak üzere tam donanım yüklenmesi.
  • Depolama protokolü yükleme:NVMe-oF (hem TCP hem de RoCE varyantları), iSER ve SRP için yerel destek, yazılım tabanlı hedef işlemeyi ortadan kaldırır.
  • Sanalleştirme ve Çoklu Kiralama:Port başına 1.000 sanal fonksiyona kadar (VF), üst üste tünel boşaltması ile hat hızı kapsülleme / dekapsülleme sağlar.
  • Güvenlik ve Telemetri:200Gbps'lik iç IPsec/TLS şifreleme, artı donanım tabanlı akış izleme (örneğin bağlantı izleme, histogramlar).

Buna göreMCX653106A-HDAT özellikleri, adaptör, PCIe 4.0/5.0 x16 arayüzlerini destekler, tam 200GbE hat hızında bile ev sahibi tarafında engelleme sağlamaz.

4. Uygulama ve ölçeklendirme tavsiyeleri (tipik topoloji ile)

Onaylanmış bir referans topolojisi şunlardan oluşur:

  • Hesaplama Katmanı:48 çift soketli sunucu, her biri bir tane ile donatılmıştırMCX653106A-HDAT(iki portlu 100GbE yapılandırması) Portlar aktif-aktif bir LAG olarak bağlanır.
  • Depolama katmanı:Her biri iki adet olan 12 tüm flash NVMe-oF hedef sunucusuMCX653106A-HDAT Ethernet adaptör kartıBirimler: biri ön uç hesaplama erişimi için, diğeri arka uç kopyalama için.
  • Ağ Katmanı:Dört 100GbE Spine anahtarı ve sekiz Leaf anahtarı, DCBX, PFC (RoCE için sınıf 3) ve ECN eşiği ile yapılandırılmıştır.

200 düğümün ötesinde ölçeklendirme için mimari, donanım yüklenmesi (tamamen) ile EVPN-VXLAN kullanan çok pod tasarımlarını destekler.MCX653106A-HDAT uyumluKapasite değerlendirmesinde,MCX653106A-HDAT fiyatıkullanılabilir 100GbE bağlantı noktasına göre, kıyaslanabilir Fibre Channel veya InfiniBand çözümlerinden yaklaşık% 40 daha düşüktür.

5İşlemler, İzleme, Sorun Çözme ve Optimizasyon

RDMA/RoCE dağıtımlarının etkili bir şekilde çalıştırılması için özel araçlar gereklidir.

Çevre Önerilen Eylemler ve Araçlar
Telemetri ve Görünürlük Donanım sayaçlarını etkinleştirmlx5cmdve Prometheus ihracatçısı; PFC molalarını, ECN işaretlenmiş paketleri ve RoCE yeniden iletimlerini izler.
Trafik sıkışıklığı tespiti KullanımıEttool -SKuyruk istatistikleri için; NVIDIA'nın Docker tabanlı tıkanıklık telemetri kitini dağıtın.
Firmware ve Sürücü Mgmt Devam et.MCX653106A-HDAT uyumluFirmware sürümleri (≥ 26.35.x) DOCA 2.5+ sürücü yığınının yanında.
Optimizasyon Rehberleri Jumbo çerçeveler için MTU=9000 ayarlayın; roce_rx_qos_policy ayarlayın; karışık iş yükleri için dinamik kesinti moderesyonunu etkinleştirin.

Sorun giderme için, RoCEv2-specifik meta verileri yakalamak içinRdmatoolveİBB_devinfoGenel tuzaklar arasında yanlış yapılandırılmış PFC öncelikleri (tüm ağ cihazları arasında tutarlılığı sağlamak) ve PCIe bağlantı hızlarının uyumsuzluğu (tekrarlama ile doğrulama) bulunur.İspci -vvv)

6Özet & Değer Değerlendirme

BuNVIDIA Mellanox MCX653106A-HDATStandart Ethernet kumaşlarını yüksek performanslı, kayıpsız ağlara dönüştürmek için kanıtlanmış, üretime hazır bir platform sunar.

  • Gecikme:Deterministik alt-10μs NVMe-oF okuma gecikmesi (P99), gerçek zamanlı analiz ve HPC yakınlaşmasını sağlar.
  • Devamı:Sınıf yakınındaki 200GbE hızı, sıfır paket kaybı ile, karşı doğrulanmıştır.MCX653106A-HDAT özellikleri.
  • CPU verimliliği:Daha önce ağ ve depolama yığınları tarafından tüketilen CPU çekirdeklerinin% 30'una kadarını serbest bırakır.
  • TCO:Özel bağlantılarla karşılaştırıldığında,MCX653106A-HDAT satılıyor.fiyatlandırma, standart Ethernet geçiş ile birleştirildiğinde, üç yıllık işletme maliyetlerini yaklaşık olarak% 35-50 oranında azaltır.

Mimarlar ve operasyon yöneticileri bu çözümü AI kumaşları, ayrılmış depolama ve ultra düşük gecikme mali sistemler için güvenle dağıtabilirler.yetkiline başvurMCX653106A-HDAT veri sayfasıve NVIDIA'nın DOCA belge kütüphanesi.