DeepSeek, V4 resmi sürümünü Temmuz ortasında piyasaya sürecek ve yoğun saatlerde API fiyatlandırmasını normal ücretin iki katı olarak belirleyecek.
Temmuz ortasında gelecek olan DeepSeek V4 resmi sürümü, yoğun saatlerde müşterilerden iki kat ücret alacak — bu fiyatlandırma stratejisi, Çinli laboratuvarın Anthropic ve OpenAI karşısındaki mevcut maliyet avantajı üzerine inşa ediliyor.
"Yoğun-düşük saat fiyatlandırması, yüksek talep dönemlerinde bilgi işlem kapasitesini daha verimli tahsis etmemizi sağlıyor," diyen bir DeepSeek sözcüsü, resmi sürüm için temel token başına ücreti açıklamadı.
Yoğun saatler günlük olarak 09.00-12.00 ve 14.00-18.00 arasında çalışıyor ve ücretler düşük saat fiyatının 2 katı olarak belirleniyor. Deutsche Bank analisti Jim Reid'e göre, toplam 1,6 trilyon parametresinin 49 milyarını her ileri geçişte aktifleştiren V4-Pro modeli, eşdeğer görevler için Anthropic'in Claude Fable 5'inin maliyetinin yaklaşık %1,5'i kadar bir maliyete sahip.
Bu fiyatlandırma hamlesi, DeepSeek'in 27 Haziran'da piyasaya sürdüğü ve donanım yükseltmesi olmadan V4-Flash üretim hızını %85'e kadar artıran spekülatif kod çözme çerçevesi DSpark'ın ardından geliyor. V4'ü ölçekli olarak çalıştıran işletmeler için, daha hızlı çıkarım ve kademeli fiyatlandırma, token başına maliyetleri daha da düşürebilir — bu da beklenen halka arzları öncesinde ABD'li model sağlayıcılarının marjlarını baskılayabilir.
Resmi sürümün lansmanı, hızlı bir iterasyon dönemini tamamlıyor. DeepSeek'in DSpark çerçevesi, önceki MTP-1 taban çizgisine kıyasla V4-Flash'te kullanıcı başına üretim hızını %60 ila %85, V4-Pro'da ise %57 ila %78 oranında artırdı. Şirket ayrıca, spekülatif kod çözme taslak modelleri için tam eğitim yığını olan DeepSpec'i MIT lisansı altında açık kaynak olarak yayımladı — bu teknolojiyi Qwen3 ve Gemma modellerini kullanan ekiplerin kullanımına sundu.
Çinli Yapay Zeka Laboratuvarları Fiyatlandırma Kıskacını Sıkılaştırıyor
DeepSeek, ABD fiyatlandırmasına meydan okumada yalnız değil. Eski adı Zhipu AI olan Z.ai, bu hafta GLM5.2'yi piyasaya sürdü — Jefferies stratejisti Christopher Wood'un "kurumsal pazar için Anthropic'e neredeyse eşit bir rakip" olarak nitelendirdiği model, token başına maliyetin dörtte biriyle geliyor. Morgan Stanley traderları, "talep kompozisyonunun açıkça düşük maliyetli modellere kaydığını" belirtti.
Yoğun-düşük saat mekanizması, ücretlerin yoğun saat seviyesinin yarısına düştüğü düşük saatlerde DeepSeek'in maliyet avantajını daha da genişletebilir. Deutsche Bank'tan Reid, 18 Haziran'da yazdığı notta, günlük görevlerin yaklaşık %90'ı için DeepSeek'in V4-Pro'sunun "Anthropic'in Claude Fable 5'inin maliyetinin yaklaşık %1,5'i ile aynı işi yaptığını" belirtti.
Bu Yatırımcılar İçin Ne Anlama Geliyor?
Daha ucuz modellere geçiş, halka arz planlayan ABD'li yapay zeka sağlayıcılarının değerleme anlatılarını tehdit ediyor. New York Times'ın haberine göre OpenAI, teknoloji halka arzlarındaki düşük performans ve artan fiyat rekabeti nedeniyle halka arz takvimini yeniden değerlendiriyor. Anthropic de kurumsal müşterilerin düşük maliyetli alternatifleri değerlendirmesiyle benzer bir baskıyla karşı karşıya.
GPU üreticileri ve bulut sağlayıcıları için bu eğilim iki ucu keskin bir bıçak. Daha düşük token başına maliyetler, daha geniş bir benimsemeyi tetikleyebilir — Deloitte, çıkarım iş yüklerinin 2026'da tüm yapay zeka bilgi işleminin yaklaşık üçte ikisini oluşturacağını, 2023'teki üçte birlik orandan arttığını öngörüyor. Ancak işletmeler iş yüklerini daha ucuz veya kendi kendine barındırılan modellere kaydırırsa, hiper ölçekli bulut sağlayıcılarında gelir büyümesi yavaşlayabilir. DeepSeek'in yoğun-düşük saat fiyatlandırması, yapay zeka fiyat savaşında yeni bir aşamayı işaret ediyor; Çinli laboratuvarların yazılım optimizasyonu ve agresif fiyatlandırma kullanarak ABD'li yerleşik oyunculardan pazar payı kazandığı bir dönem.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.