Çinli DeepSeek şaşırttı: Daha hızlı ve verimli yapay zekalar için kritik atılım

Çin merkezli yapay zeka şirketi DeepSeek, geçtiğimiz hafta beş farklı yazılım reposunu açık kaynak topluluğuna sundu. Bu hamle, batılı organizasyonlar tarafından ” şaibeli” ve “güvenilmezlik” gibi eleştirilerle karşılaşan DeepSeek’in şeffaflık vurgusu yapma çabası olarak dikkat çekiyor. Açıklanan yazılımlar arasında, özellikle AI eğitimi ve çıkarım işlemleri için tasarlanmış olan Fire-Flyer Dosya Sistemi (3FS) büyük ilgi topladı. DeepSeek bir kez daha şaşırttı
3FS, DeepSeek’in iç kullanımında AI iş yükleri için geliştirdiği Linux tabanlı bir dosya sistemi. Modern katı hal sürücülerinin (SSD) ve RDMA ağlarının özelliklerini kullanan bu sistem, dağıtık uygulamaların dağıtımını basitleştiriyor. Yüksek performans standartlarıyla dikkat çeken 3FS, GPU’larda çalışan AI modellerinin sürekli veri erişim ihtiyaçlarını karşılamak için optimize edilmiş. Bununla birlikte, DeepSeek’in tasarımı, rastgele okuma taleplerine öncelik veriyor ve okuma önbellekleme kullanmıyor.
Firmanın dosya sistemi, 180 düğümden oluşan bir kümede kullanıldığında 6,6 TiB/s’lik bir toplam okuma bant genişliğine ulaşabiliyor. GraySort benchmark’ında ise, 25 düğümlü bir kümeyle 3,66 TiB/dakika okuma hızına ulaşarak dikkatleri üzerine çekti. Startup şirketi Perspective AI, DeepSeek’in bu performans rakamlarını “bir sonraki seviye” olarak nitelendiriyor ve 3FS’in AI ve veri yoğunluklu iş yükleri için devrim niteliğinde bir çözüm sunduğunu belirtiyor.
DeepSeek, geçtiğimiz yaz da Fire-Flyer 2 adlı yüksek performanslı AI mimarisinin özelliklerini açıklamıştı. Firma, 3FS, HaiScale ve yazılım yığınının diğer unsurları sayesinde, Nvidia’nın DGX-A100 sunucularının performansının yüzde 80’ini yüzde 50 fiyatla ve yüzde 40 daha az enerji kullanarak elde etmişti. Fire-Flyer 2, her biri 16TB SSD’ye sahip 180 depolama düğümü, iki adet 200Gbps NUC ve PCIe üzerinden 10.000 Nvidia A100 GPU kullanıyordu.






