DeepSeek, yeni nesil büyük dil modeli DeepSeek-R2'yi 15 Ağustos - 30 Ağustos 2025 tarihleri arasında piyasaya sürmeye hazırlanıyor. Lansman takvimi, DeepSeek'in kendi yapay zeka modeliyle yapılan bir etkileşim sırasında ortaya çıktı ve ChatGPT-5'in piyasaya sürülmesinden sadece birkaç gün sonra yakın zamanda piyasaya sürüleceğinin sinyalini verdi.
DeepSeek-R2'nin, daha gelişmiş bir Uzman Karışımı (MoE) kurulumunu benimseyerek mimaride önemli bir sıçrama yapması bekleniyor. Ayrıca, çıkarım ağırlıklı iş yüklerini daha iyi idare etmek için daha akıllı bir geçit ağı entegre edecek.
Geliştirme sürecine aşina kaynaklara göre, model 1,2 trilyon parametreye kadar ölçeklenebilir; bu da 671 milyar parametreye sahip DeepSeek-R1'in neredeyse iki katı . Bu, 1,8 trilyondan fazla parametreye sahip ChatGPT-4/5'ten bile daha düşük olacak.
Çin, yerli yapay zekanın kendi kendine yeterliliğini arıyor
Yurt içi yapay zekanın kendi kendine yeterliliğine doğru stratejik bir adım olarak, model tamamen Huawei'nin Ascend 910B yongaları üzerinde eğitildi. %82 kullanım oranıyla 512 PFLOPS FP16 performansı sunan Huawei'nin hesaplama kümesinin, Nvidia'nın A100 kümesinin performansının %91'ine ulaştığı bildiriliyor. Analistler, bunu Çin'in ABD yapımı yapay zeka donanımlarına olan bağımlılığını azaltmada kritik bir adım olarak görüyor .
DeepSeek-R2'nin eğitiminin, yerel donanım ve optimizasyon teknikleri sayesinde GPT-4'ten %97 daha ucuz olduğu bildiriliyor. Analistler, DeepSeek'in daha düşük fiyatlarla API erişimi sunmasını bekliyor; bu da OpenAI ve Anthropic'in hakim olduğu mevcut fiyatlandırma modellerini altüst edebilir.
DeepSeek-R2 etrafındaki beklenti, Çin teknoloji hisselerinde hareketlilik yarattı. Yapay zeka çip üreticisi Cambricon'un hisse fiyatı %20 arttı ve piyasa değeri 355 milyar yuanı (yaklaşık 49,7 milyar dolar) aştı.
İlgili haberlerde, Huawei, Birleşik Önbellek Yöneticisi (UCM) adlı yeni bir yapay zeka çıkarım çerçevesini kullanıma sundu. Model çıkarımını hızlandırmak üzere tasarlanan UCM, KV Önbellek verilerinin HBM, DRAM ve SSD'ler gibi bellek katmanlarında nasıl işlendiğini optimize ediyor. China UnionPay ile yapılan testlerde Huawei , gecikmede %90'a varan bir azalma ve verimlilikte 22 kat artış bildirdi. Şirket, Eylül ayında UCM'yi açık kaynaklı hale getirmeyi planlıyor.
DeepSeek-R2'nin lansmanı ve Huawei'nin UCM çerçevesinin tanıtımı, Çin'in yapay zekâ hedeflerinde büyük bir değişime işaret ediyor. Bu gelişmeler, Çin'in Batılı çiplere veya yazılım araçlarına güvenmeden yüksek performanslı yapay zekâ sistemleri geliştirip çalıştırdığı bir geleceğe işaret ediyor.