Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand Anahtar Teknik Çözümü

April 15, 2026

Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand Anahtar Teknik Çözümü

1Proje Arkaplanı ve Gereksinimler Analizi

Modern AI eğitim kümeleri ve yüksek performanslı bilgisayar (HPC) ortamları, yaygın bir ölçeklendirme zorluğu ile karşı karşıyadır: GPU sayıları ve işlem yoğunluğu arttıkça,TCP/IP üst masrafları nedeniyle geleneksel Ethernet kumaşları birincil sıkıntı haline geliyorRDMA'ya (Uzak Doğrudan Bellek Erişimi) dayanan iş yükleri için, mikrosaniye düzeyinde bile titreşim, etkili GPU kullanımını %30-40 oranında azaltabilir.Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0InfiniBand anahtarı, kolektif işlemler, tüm azaltma algoritmaları ve yüksek frekanslı MPI iletişimleri için optimize edilmiş kayıpsız, deterministik bir kumaş sağlayarak bu zorlukları doğrudan ele alır.

Bir sonraki nesil AI/HPC ağları için temel gereksinimler şunlardır: mikro saniyeden az bir geçiş gecikmesi, 400Gb/s NDR hızlarını desteklemek, donanım tabanlı ağ içi hesaplama (SHARP v2),ve mevcut HDR altyapısı ile sorunsuz geri uyumluluk.920-9B210-00FN-0D0Tüm bu kriterleri karşılarken, kurumsal düzeyde yönetilebilirlik ve telemetri sunar.

2Genel Ağ ve Sistem Mimarlığı Tasarımı

Önerilen mimari, iki katmanlı bir yağ ağacı (omurga yaprağı) topolojisine odaklanır.dağıtılmış eğitimde tipik olan tüm-herkese iletişim kalıpları için tam bölme bant genişliği ve deterministik gecikme sağlarOmurilik katmanı:NVIDIA Mellanox 920-9B210-00FN-0D0her biri bir NDR kumaş omurgası olarak çalışan anahtarlar. Yaprak anahtarları (örneğin, QM9700 serisi) ConnectX-7 veya BlueField-3 adaptörleri aracılığıyla hesaplama düğümlerine bağlanır,omurganın yukarı bağlantıları 400Gb/s NDR hızlarında çalışırken.

2000 GPU'dan fazla büyük ölçekli dağıtımlar için, üç katmanlı bir mimari (core-aggregation-access) uygulanabilir.920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRBu tasarım doğrusal performans ölçeklendirmeyi sağlar ve bir forklift yükseltmesi gerektirmeden gelecekteki NDR200 (800Gb/s) genişlemesini destekler.Resmi920-9B210-00FN-0D0 InfiniBand anahtarı OPNÇoklu site satın alma işlemini basitleştirir ve tüm doku boyunca sabit yazılım tutarlılığını sağlar.

3Çözümdeki 920-9B210-00FN-0D0'nun Rolü ve Anahtar Özellikleri

Bu920-9B210-00FN-0D0InfiniBand doku içinde yüksek performanslı omurga / çekirdek elemanı olarak hizmet eder.

  • 400Gb/s NDR port yoğunluğu:Her biri.920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDRanahtar, 500 metreye kadar esnek kablolama için hem bakır hem de optik alıcıları destekleyen 32 400Gb / s'ye kadar port sağlar (tek mod).
  • Ağ içi Bilgisayar (SHARP v2):Donanım hızlandırılmış tüm azaltma işlemleri, AI eğitim iş yükleri için kolektif iletişim süresini 8 katına kadar azaltır ve GPU kullanımını doğrudan iyileştirir.
  • Uyumlu Yönlendirme ve Sıkışıklık Kontrolü:Dinamik yol seçimi, sıcak nokta oluşumunu önler ve incast trafik kalıpları altında deterministik gecikme sağlar.
  • RDMA'nın Converged Ethernet (RoCE) Alternatifi:RoCE'den farklı olarak, yerel InfiniBand920-9B210-00FN-0D0PFC konfigürasyonu gerektirmez ve bağlantı kullanımının %95'inde bile tutarlı performans sağlar.

Mühendisler920-9B210-00FN-0D0 veri sayfasıve920-9B210-00FN-0D0 özellikleriDetaylı güç (tipik 350W), termal ve gecikme rakamları için (200ns altındaki geçiş gecikmesi).920-9B210-00FN-0D0 uyumluTüm NVIDIA InfiniBand uç noktaları ve üçüncü taraf NDR optikleri ile.

4. Uygulama ve ölçeklendirme önerileri (Topoloji Örnekleri)

Küçük kümeler (128-256 GPU):Tek omurilik 2x920-9B210-00FN-0D0Her biri 8-16 yapraklı anahtarlara bağlanır.Orta Cluster (512-1024 GPU):Dört omurilik anahtarı engelleme olmayan bir konfigürasyonda, her yaprak anahtarının 4 yukarı bağlantısı vardır (2 omurilik başına).Büyük Klüster (2048+ GPU):Çekirdek katmanı 8xNVIDIA Mellanox 920-9B210-00FN-0D0anahtarlar, aynı modeli kullanan toplu katman ve QM9700 serisi ile erişim katmanı. Tüm bağlantılar 400Gb/s NDR, isteğe bağlı NDR200 hazırlığı ile.

Maliyetleri değerlendiren kuruluşlar için,920-9B210-00FN-0D0 fiyatıToplam Mülkiyet Maliyetleri'ne (TCO) dahil edilirken, üst düzey Ethernet anahtarlarına karşı rekabetçi bir şekilde konumlandırılmıştır.920-9B210-00FN-0D0 satılıkNVIDIA'nın yetkili dağıtım ağı üzerinden, tipik olarak 4-6 haftalık teslim süreleri ile.

5İşlemler, İzleme, Sorun Çözme ve Optimizasyon

Yönetim, gerçek zamanlı telemetri, öngörüsel arıza analizi ve otomatik onarım sağlayan NVIDIA Unified Fabric Manager (UFM) aracılığıyla merkezileştirilmiştir.920-9B210-00FN-0D0 InfiniBand anahtarı OPN çözümüBunlara şunlar dahildir:

  • Performans Bazalları:Mikro patlamaları tanımlamak için UFM'in gecikme ısı haritalarını kullanın.920-9B210-00FN-0D0 özellikleriECN işaretleri ve tampon işlenmesi için donanım sayaçlarını onaylayın.
  • Firmware Yönetimi:Tüm ünitelerin aynı NDR firmware şubesinde kalmasını sağlayın.920-9B210-00FN-0D0 veri sayfasıConnectX-7 ve BlueField-3 için uyumluluk matrisini içerir.
  • Hata Szenaryosu:Yedek güç kaynakları ve fan modülleri N + 1 yedekliliğini sağlar. UFM, trafikin arızalı bağlantılar veya anahtarlar etrafında otomatik olarak yönlendirilmesini sağlar.
  • Optimizasyon İpuçları:Tüm omurilik portlarında uyarlanabilir yönlendirmeyi etkinleştir; küresel duraklama çerçevelerini devre dışı bırak; tüm azaltma yoğun iş yükleri için SHARP'yi yapılandır;920-9B210-00FN-0D0 InfiniBand anahtarı OPNFiziksel portları mantıksal rollere eşleştirmek için tanımlayıcılar.

6Özet & Değer Değerlendirme

BuMellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0Yüksek performanslı AI ve HPC kumaşları için temel bir yapı taşını temsil eder. 400Gb/s NDR bant genişliği, mikrosaniye altındaki geçiş gecikmesi ve SHARP v2 ağ içi işlemcilik sağlayarak,Genellikle GPU ölçeklendirmeyi sınırlayan ağ sıkıntılarını ortadan kaldırır.920-9B210-00FN-0D0Bu sadece bir anahtar değil, tam bir değişim.920-9B210-00FN-0D0 InfiniBand anahtarı OPN çözümüBu, mevcut HDR altyapıları ile tam uyumluluk, UFM aracılığıyla kurumsal düzeyde yönetilebilirlik ve gelecekteki NDR200 hızlarına açık bir göç yolu içerir.RDMA/HPC/AI kümesi bağlantı performansını optimize etmek isteyen ağ mimarları ve BT yöneticileri için, bu anahtar, daha yüksek GPU kullanımı, daha kısa iş tamamlama süreleri ve daha düşük operasyonel genel masraflar yoluyla ölçülebilir ROI sağlar.

Anahtar Özellikler Referansı

Parametreler Değer
Model NVIDIA Mellanox 920-9B210-00FN-0D0
Veri oranı 400Gb/s NDR (port başına)
Temel OPN 920-9B210-00FN-0D0 InfiniBand anahtarı OPN
Tam Yapılandırma 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR
Gecikme Değiştirme <200ns
Güç tüketimi ~350W (tipik)