NVIDIA Mellanox MCX653105A-HDAT Sunucu Adaptörü Uygulamada: RDMA/RoCE Düşük Gecikmeli Taşıma ile Verimi Artırma

March 16, 2026

hakkında en son şirket haberleri NVIDIA Mellanox MCX653105A-HDAT Sunucu Adaptörü Uygulamada: RDMA/RoCE Düşük Gecikmeli Taşıma ile Verimi Artırma
Arka Plan ve Zorluk: Depolama ve Hesaplama Darboğazı

Önde gelen bir finansal teknoloji firması, yeni nesil büyük veri analitik platformunu inşa ederken ciddi ağ G/Ç darboğazlarıyla karşılaştı. Mevcut 10GbE altyapısı, gerçek zamanlı risk değerlendirmesi ve yüksek frekanslı ticaret analizi için gereken devasa veri akışını yönetmekte zorlanıyordu. CPU çekirdekleri, döngülerinin %30'una kadarını yalnızca ağ trafiğini yönetmek için harcıyor, kritik uygulama işlemesi için daha az kaynak bırakıyordu. Temel zorluk açıktı: dağıtılmış veritabanlarını ve yapay zeka güdümlü analitiklerini ölçeklendirmek için, tüm sunucu filosunu baştan sona yenilemeden gecikmeyi önemli ölçüde azaltmaları ve etkili sunucu verimini artırmaları gerekiyordu.

Geleneksel TCP/IP ağ oluşturma artık geçerli değildi. Çekirdek ağ yığınının ek yükü, bellek içi veritabanlarının ve NVMe tabanlı depolama kümelerinin performansını doğrudan etkileyen öngörülemeyen gecikme artışlarına neden oluyordu. Firma, ağ işlemesini CPU'dan boşaltabilen ve sunucular ile depolama arasında doğrudan, yüksek hızlı veri hareketini sağlayan bir çözüme ihtiyaç duyuyordu. Birkaç seçeneği değerlendirdikten sonra, kritik hesaplama ve depolama düğümlerine 迈络思(NVIDIA Mellanox) MCX653105A-HDAT sunucu adaptör kartını dağıtma kararı alındı.

Çözüm ve Dağıtım: RDMA ve RoCE Yeteneklerini Açığa Çıkarma

Dağıtım, NVIDIA Mellanox ConnectX-6 ailesinden çift portlu 100Gb/s'lik bir adaptör olan MCX653105A-HDAT üzerine odaklandı. Birincil amaç, veri aktarımları için CPU'yu atlamak üzere Converged Ethernet Üzerinden RDMA'yı (RoCE) uygulamaktı. NVIDIA Mellanox MCX653105A-HDAT, mevcut ağ anahtarlarıyla uyumluluğu sağlayarak standart bir Ethernet ağı üzerinde çalışırken InfiniBand'ın düşük gecikme avantajlarını sunan RoCE için yerel donanım desteği nedeniyle seçildi.

Mühendislik ekibi, öngörülebilir performansla her-yöne bağlantı sağlayan bir spine-leaf topolojisinde sunucuları yapılandırdı. Başarının anahtarı, hem veritabanı sunucularında hem de tüm NVMe depolama dizilerinde MCX653105A-HDAT Ethernet adaptör kartının dağıtılmasıydı. Donanım tabanlı RoCE boşaltmalarını kullanarak, ekip verimli RDMA işlemleri için kritik bir gereksinim olan sıfır paket kaybını sağlamak üzere Öncelikli Akış Kontrolü (PFC) ile kayıpsız bir ağ oluşturdu. MCX653105A-HDAT ConnectX adaptör PCIe ağ kartı burada temel oldu, çünkü gelişmiş tıkanıklık kontrol mekanizmaları tam yük altında bile ağ kararlılığını korudu.

Ölçülen Sonuçlar: Verim Artışı ve Gecikme Çöküşü

Performans artışı anında ve önemliydi. Yükseltmeden önce, mevcut 10GbE altyapısı, yüksek CPU kullanımıyla sunucudan sunucuya verimi yaklaşık 1,2 GB/s ile sınırlıyordu. MCX653105A-HDAT adaptörlerini entegre edip RoCEv2'yi etkinleştirdikten sonra, küme aşağıdaki sonuçları elde etti:

Metrik Önce (10GbE/TCP) Sonra (100GbE/RoCE MCX653105A-HDAT ile)
Etkili Verim (NVMe-oF) ~1,1 GB/s ~11,5 GB/s
Ortalama Gecikme (Gidiş-Dönüş) ~150 µs < 5 µs
CPU Kullanımı (Ağ G/Ç) ~30% < 5%

Bu 10 katlık verim artışı, aynı anda CPU çekirdeklerini uygulama düzeyinde işlemeye serbest bırakırken elde edildi. MCX653105A-HDAT donanım boşaltmaları, hat hızında 100Gb/s performans elde etmede kritik öneme sahipti ve dağıtılmış veritabanının ek sunuculara ihtiyaç duymadan yatay olarak ölçeklenmesine olanak tanıdı. Resmi MCX653105A-HDAT spesifikasyonlarında ayrıntılı olarak belirtilen RDMA yetenekleri, çekirdeği atlayarak doğrudan bellekten belleğe aktarımları mümkün kıldı ve gecikmeyi daha önce yalnızca özel HPC kümelerinde görülen seviyelere indirdi. Ekip ayrıca, optimum Gen4 bant genişliği kullanımını sağlamak için PCIe parametrelerini ince ayar yapmak üzere MCX653105A-HDAT veri sayfasından yararlandı.

Sonuç ve Gelecek Görünümü

Bu dağıtım, MCX653105A-HDAT Ethernet adaptör kartı çözümünün yalnızca artımlı bir yükseltme değil, veri odaklı kuruluşlar için dönüştürücü bir unsur olduğunu göstermektedir. Verimli RDMA/RoCE taşıması yoluyla CPU darboğazını çözerek, MCX653105A-HDAT, firmanın mevcut depolama ve hesaplama yatırımlarının değerini en üst düzeye çıkarmasına olanak tanıdı. Başarı, makine öğrenimi eğitim kümelerine dağıtımı genişletmenin yolunu açtı; burada MCX653105A-HDAT'ın mevcut piyasadaki düşük gecikme özellikleri, model eğitim sürelerini daha da hızlandıracaktır. Yüksek performanslı altyapıyı değerlendiren mimarlar ve mühendisler için, MCX653105A-HDAT'ın mevcut işletim sistemleri ve yönetim araçlarıyla uyumlu olması, modern, yüksek verimli veri merkezleri oluşturmak için sorunsuz bir seçim olmasını sağlar.