Yapay Zeka Yatırımcıları Piyasa Testinde %33 Kaybetti, Wall Street Mülakatında Sınıfta Kaldı

Dünyanın önde gelen sekiz yapay zeka modeline bir yatırım hesabı erişimi veren iddialı bir yarışma, toplam portföyde yaklaşık %33'lük bir kayıpla sonuçlandı; bu da yapay zekanın analitik yeteneği ile gerçek dünyadaki ticari zekası arasındaki uçurumun çarpıcı bir göstergesi oldu. Teknoloji girişimi Nof1 tarafından düzenlenen etkinlikte, 32 olası sonuçtan sadece altısı karla sonuçlandı ve büyük dil modellerinin (LLM'ler) otonom finans piyasaları için hazır olduğu anlatısına meydan okudu.

Nof1 kurucusu Jay Azhang, sonuçlara ilişkin yaptığı sert değerlendirmede, "Şu an bir LLM'ye para verip kendi başına ticaret yapmasına izin vermenin zamanı değil. Bu yol henüz uygulanabilir değil" dedi.

Alpha Arena yarışması; OpenAI'den ChatGPT, Google'dan Gemini ve Anthropic'ten Claude'un da aralarında bulunduğu modellere, iki haftalık dönemler boyunca ABD teknoloji hisselerinde işlem yapmaları için dört bağımsız turda her biri 10.000 dolar sağladı. Performans sadece zayıf değil, aynı zamanda son derece tutarsızdı. Bir turda Alibaba'nın Qwen modeli 1.418 işlem gerçekleştirirken, Elon Musk'ın xAI'sinden Grok 4.20 modeli sadece 158 işlem yaptı.

Sonuç, 1,8 trilyon dolarlık yapay zeka endüstrisi için kritik bir ayrımı vurguluyor: araştırma ve uygulama arasındaki fark. Google ve OpenAI gibi teknoloji devlerinin modelleri devasa miktarda veriyi işleyebilse de, şu anda karlı ticaret için gerekli olan piyasa zamanlaması, pozisyon büyüklüğü ve risk yönetimi konusundaki nüanslı anlayıştan yoksunlar. Bu başarısızlık, yapay zekanın finanstaki en acil etkisinin otonom bir ajan olarak değil, insan tüccarlar için bir yardımcı pilot (co-pilot) olacağını gösteriyor.

Araştırma vs. Gerçeklik

Uzmanlar, LLM'lerin araştırma odaklı görevlerde mükemmel olduğunu ancak işlem yürütmede bocaladığını belirtiyor. Azhang, modellerin analist derecelendirmelerinden içeriden öğrenenlerin ticareti faaliyetlerine kadar sayısız piyasa değişkeninin önemini düzgün bir şekilde tartmakta zorlandığını, bunun da yanlış zamanlanmış ve kötü boyutlandırılmış bahislere yol açtığını belirtti. Bu durum, modellerin belirgin "kişilikler" geliştirmesinde açıkça görüldü; Claude'un uzun (long) pozisyonları tercih ettiği, Gemini'nin ise hisse senetlerini açığa satmakta (short) tereddüt etmediği bildirildi.

Bu analitik güç, Intelligent Alpha tarafından yapılan ayrı bir kıyaslama testinde doğrulandı. Kazanç tahmini revizyonlarının yönünü tahmin etmeye odaklanan bu çalışmada, OpenAI'den ChatGPT, 2025'in dördüncü çeyreği için %68'lik bir doğruluk oranına ulaştı. Bu, LLM'lerin tek başlarına bir portföyü yönetmek için henüz güvenilir olmasalar bile, insan karar verme sürecini destekleyebilecek güçlü analiz araçları olduğunu gösteriyor.

Karı Kanıtlama Sorunu

Yapay zekanın ticaret yeteneğini değerlendirmek, "ileriye bakma önyargısı" (lookahead bias) olarak bilinen temel bir metodolojik kusur nedeniyle karmaşıktır. 2026 yılında 2020 piyasa verileri üzerinde test edilen bir model sonucu zaten "bilmektedir", bu da tarihsel geriye dönük testleri (backtesting) işe yaramaz hale getirir. Bu durum araştırmacıları, kendi sınırlamaları olsa da gerçek değerlendirme için Alpha Arena gibi canlı yarışmaları kullanmaya zorladı.

YipitData'nın eski kurucu ortağı olan ve şu an Flat Circle blogunu yazan Jim Moran, çoğu halka açık deneyin kesin sonuçlar çıkarmak için çok kısa ve gürültülü olduğunu savundu. Ayrıca, eski Coatue Management yöneticisi Alexander Izydorczyk, takip ettiği yapay zeka ticaret botlarının hiçbirinin kalıcı aşırı getiri göstermediğini belirtti; bunun nedeni muhtemelen büyük risk fonları (hedge funds) tarafından kullanılan tescilli kantitatif tekniklerden yoksun olmalarıdır. Izydorczyk blogunda yazdığı gibi: "Bir LLM ajanı ticaret stratejisi gerçekten işe yaramaya başladığında, bunu hemen duyamazsınız."

Nof1, yapay zekalara daha fazla veri ve yetenek vererek Alpha Arena'nın ikinci sezonunu düzenlemeyi planlıyor. Ancak firmanın ana işi otonom fonlar kurmak değil, bireysel yatırımcıların kendi yapay zeka ajanlarını oluşturmaları için araçlar sağlamaktır. Bu iş modelinin kendisi, yapay zekanın mevcut durumunun pragmatik bir kabulü olarak hizmet ediyor: O güçlü bir araçtır ancak şimdilik hala bir insana ihtiyaç duymaktadır.

Bu makale sadece bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.