NVIDIA Mellanox MCX4121A-ACAT Sunucu Adaptörü Teknik Çözüm

April 22, 2026

NVIDIA Mellanox MCX4121A-ACAT Sunucu Adaptörü Teknik Çözüm

Bu teknik çözüm, ağ mimarları, satış öncesi mühendisler ve operasyon yöneticileri için tasarlanmıştır. RoCE (Converged Ethernet Üzerinden RDMA) teknolojisini kullanarak düşük gecikmeli, yüksek verimli veri merkezi ağ altyapısının nasıl oluşturulacağını ayrıntılı olarak açıklar. NVIDIA Mellanox MCX4121A-ACAT sunucu adaptörü. Belge, mimari tasarımı, temel teknolojileri, dağıtım stratejilerini ve operasyonel en iyi uygulamaları kapsar.Modern veri merkezleri üç temel zorlukla karşı karşıyadır: geleneksel TCP/IP yığınlarının CPU yükü, dağıtılmış uygulamalar için öngörülemeyen gecikme titremesi ve doğu-batı bant genişliğinin artan maliyeti. İş yükleri AI eğitimi, dağıtılmış veritabanları ve NVMe-oF depolama ağlarına doğru kaydıkça, RDMA boşaltma olmadan geleneksel 10GbE veya 25GbE adaptörler kritik darboğazlar haline gelir. Hedef ortam - tipik olarak orta ila büyük ölçekli bulut veya kurumsal veri merkezleri - 3μs'nin altında gecikme, ağ işleme için %10'un altında CPU kullanımı ve sunucu başına hat hızında 50Gb/s toplam verim gerektirir. MCX4121A-ACAT Ethernet adaptör kartı bu gereksinimleri doğrudan karşılar.

2. Genel Ağ ve Sistem Mimari Tasarımı

Önerilen mimari, kayıpsız Ethernet taşıma ile iki katmanlı yaprak-omurga topolojisini izler. Temel tasarım ilkeleri şunları içerir:Yaprak katmanı: DCB (Veri Merkezi Köprüleme) desteğine sahip ToR anahtarları - PFC, ETS ve DCBX etkin.

Omurga katmanı:

Yapraklar arasında tam ağ bağlantısı sağlayan engellemeyen anahtarlar.

  • Sunucu katmanı: MCX4121A-ACAT ConnectX-4 Lx çift portlu 25GbE SFP28 adaptörü ile donatılmış her hesaplama/depolama düğümü.
  • Taşıma protokolü: IP yönlendirme desteği ile RoCE v2, Katman 3 sınırları boyunca RDMA'yı etkinleştirir.
  • Mimari, tutarlı mikrosaniye altı gecikmeyi korurken 48 ila 1.000'den fazla düğüme ölçeklenir. Her adaptörün çift portu, bant genişliği toplama için aktif-aktif bağlama veya yüksek kullanılabilirlik için aktif-pasif olarak yapılandırılabilir.3. NVIDIA Mellanox MCX4121A-ACAT'ın Rolü ve Temel ÖzellikleriBu çözümde, NVIDIA Mellanox MCX4121A-ACAT kritik donanım boşaltma motoru olarak hizmet vermektedir. MCX4121A-ACAT veri sayfasına göre, temel etkinleştirme özellikleri şunlardır:Donanım Tabanlı Taşıma Boşaltma:
  • Veri hareketinde CPU'nun dahil olmasını ortadan kaldırarak adaptör donanımında tam RDMA/RoCE protokol işleme.Çift Portlu 25GbE SFP28:

SR, LR ve DAC kabloları için esnek medya desteği; 10GbE ve 1GbE ile geriye dönük uyumlu.

PCIe 3.0 x8 Ana Bilgisayar Arayüzü:

Hat hızına engellemeyen, 64Gb/s'ye kadar çift yönlü bant genişliği sağlar. NVMe/TCP ve NVMe/RoCE komut işleme için yerel boşaltma. VXLAN, GENEVE ve NVGRE tünelleri için donanım hızlandırma.

  • MCX4121A-ACAT özellikleri, bellek bağlı aktarımlar için mikrosaniye altı 0.8μs gecikmeyle bağlantı başına 1 milyona kadar IOPS desteğini doğrular, bu da onu yüksek frekanslı ticaret, gerçek zamanlı analitik ve ayrıştırılmış depolama için ideal hale getirir.4. Dağıtım ve Ölçeklendirme Önerileri (Topoloji ile)
  • Tipik dağıtım, raf düzeyinde aşamalı bir dağıtımı takip eder. Aşağıda referans iki raf topolojisi bulunmaktadır:Bileşen
  • ÖzellikRaf Başına Miktar
  • Yaprak Anahtarı (25GbE)48 portlu SFP28, DCB özellikli
  • 2Hesaplama/Depolama Sunucusu

20SFP28 DAC Kablosu

3m pasif, 5m aktif

40 çift

İki raftan fazla ölçeklendirme için, omurga anahtarları tüm yaprak anahtarlarını birbirine bağlar. MCX4121A-ACAT uyumlu optikler ve kabloları değerlendirirken, PFC ve bağlantı eğitimi kararlılığını sağlamak için NVIDIA'nın uyumluluk listesinden satıcı tarafından test edilmiş SFP28 modüllerini seçin. Kuruluşlar, MCX4121A-ACAT satılık ürününü yetkili distribütörler aracılığıyla temin edebilir, MCX4121A-ACAT fiyatı genellikle toplu alıma bağlı olarak adaptör başına 400-600 ABD Doları arasında değişmektedir. 5. Operasyon İzleme, Sorun Giderme ve Optimizasyon Etkili RoCE dağıtımı proaktif izleme gerektirir. Önerilen uygulamalar şunları içerir:
Telemetri: Yerleşik RoCE sayaçları (port_xmit_wait, port_rcv_remote_physical_errors) ile NVIDIA'nın MLNX_OFED sürücü paketini kullanın. Tıkanıklık tespiti:
PFC duraklatma çerçevelerini izleyin; sürekli sıfır olmayan değerler tampon basıncını gösterir. Tampon ayarlama: Kayıpsız tampon havuzları için 2-3x BDP (Bant Genişliği-Gecikme Ürünü) yapılandırın.
ECN/RED eşikleri: Proaktif tıkanıklık önleme için %1 kuyruk derinliğinde işaretleme olasılığını ayarlayın. Yaygın sorun giderme senaryoları: RoCE performansı düşerse, tüm anahtarlarda ve adaptör üretici yazılımında DCB yapılandırmasının aynı olduğunu doğrulayın. MCX4121A-ACAT Ethernet adaptör kartı çözümü, kablo bütünlüğünü ve bağlantı sağlığını doğrulamak için tanılama araçları (ibdiagnet, mlxlink) içerir. Üretim ortamları için, bu metrikleri duraklatma çerçevelerinin düşmesi veya aşırı yeniden iletimler için uyarılarla Prometheus/Grafana panolarına entegre edin.

6. Özet ve Değer DeğerlendirmesiNVIDIA Mellanox MCX4121A-ACAT, üç boyutta ölçülebilir değer sunar: performans (mikrosaniye altı 2μs gecikme, 49Gb/s etkili verim), verimlilik (ağ G/Ç'si için %5'in altında CPU kullanımı) ve TCO (hedef IOPS için daha az sunucu ihtiyacı, özel ara bağlantı lisanslamasının ortadan kaldırılması). Yeni nesil veri merkezleri oluşturan kuruluşlar için bu adaptör, standart Ethernet ekonomisi ile yüksek performanslı bilgi işlem gereksinimleri arasındaki boşluğu dolduran, üretimde kanıtlanmış, yüksek oranda ölçeklenebilir bir MCX4121A-ACAT Ethernet adaptör kartı çözümü sunar. Ağ mimarlarının ayrıntılı kayıt seviyesi özellikleri ve entegrasyon kılavuzları için MCX4121A-ACAT veri sayfasına başvurması teşvik edilir.