OpenAI GPT-4.5 ile beklentileri karşılayamadı mı?
OpenAI'ın en güçlü modeli olduğu iddia edilen GPT-4.5, gerçekten önceki sürümlerden daha mı iyi? Yeni model beklenen etkiyi yaratamadı mı? Halüsinasyon sorunu hâlâ çözülemedi mi?
ABD merkezli yapay zeka şirketi OpenAI, son modelini piyasaya sürdü ancak GPT-4.5, beklenen etkiyi yaratamadı. “Şimdiye kadarki en büyük ve en bilgili model” olarak lanse edilen sistem, kullanıcılar ve uzmanlar arasında tartışmalara yol açtı.
BEKLENTİLERİN GERİSİNDE Mİ KALDI?
Euronews'in haberine göre; OpenAI, GPT-4.5’in önceki modellerine kıyasla daha güçlü olduğunu savunurken, bazı uzmanlar modelin performans açısından beklentilerin gerisinde kaldığını öne sürüyor. Özellikle yüksek maliyetine dikkat çeken araştırmacılar, bu fiyatlandırmanın sunulan performansla orantısız olduğunu dile getiriyor.
TechCrunch’ın haberine göre, yeni modelin işleme maliyetleri GPT-4’e kıyasla 30 kat daha fazla. Çıktı üretme maliyetinin ise 15 kat arttığı belirtiliyor. OpenAI, her 1 milyon token için 75 dolar talep ederken, bu rakam modelin 750.000 kelime işlemesi anlamına geliyor.
Buna karşın GPT-4.5’in testlerde GPT-4o ve GPT-3’ün belirli versiyonlarından daha düşük puan aldığı görülüyor. AIME matematik testinde GPT-4.5 yalnızca 36,7 puan alırken, GPT-4o Mini’nin 87,3 puana ulaştığı bildirildi. Bu durum, yeni modelin beklentileri tam anlamıyla karşılamadığı yönünde yorumlanıyor.
ELEŞTİRİLER: “LİMON” VE “HİÇBURGER” BENZETMESİ
Yapay zeka alanındaki eleştirileriyle tanınan uzman Gary Marcus, modeli “hiçburger” (nothingburger) olarak nitelendirirken, ismini açıklamak istemeyen bir başka araştırmacı ise GPT-4.5’i “limon” olarak tanımladı. Bu benzetmeler, modelin yüksek beklentilere rağmen bekleneni veremediğine işaret ediyor.
Ayrıca, modelin daha fazla donanım gerektirdiği ve OpenAI’ın elindeki GPU’ların tükendiği belirtiliyor. Şirket CEO’su Sam Altman, sosyal medya hesabı üzerinden yaptığı açıklamada, GPU kıtlığı nedeniyle modelin dağıtımını kademeli yapmak zorunda kaldıklarını ifade etti.
HALÜSİNASYON SORUNU DEVAM EDİYOR
GPT-4.5, önceki modellere kıyasla daha yüksek bir halüsinasyon oranına sahip. MIT Technology Review’un yaptığı testlerde, modelin %37 oranında yanlış veya uydurma bilgi sunduğu ortaya çıktı. Bu durum, OpenAI’ın uzun süredir üzerinde çalıştığı ancak tam olarak çözemediği hatalı bilgi üretme problemine işaret ediyor.
AVANTAJLARI VE KULLANICI DENEYİMİ
Eleştirilere rağmen OpenAI, GPT-4.5’in bazı alanlarda önemli iyileştirmeler sunduğunu belirtiyor. Modelin çok dilli MMMLU testinde 85,1 puan aldığı, önceki model olan GPT-4o’nun ise 81,5 puanda kaldığı ifade ediliyor.
Bununla birlikte, kullanıcıların GPT-4.5 ile yaptıkları etkileşimlerin %57’sinde yeni modeli tercih ettiği belirtiliyor. OpenAI araştırmacısı Mia Glaese, modelin “daha sezgisel ve doğal sohbetler yapabilme yeteneğine sahip olduğunu” savunuyor.
SAM ALTMAN: “BU MODELDE SİHİR VAR”
Tartışmalar sürerken OpenAI CEO’su Sam Altman, GPT-4.5’i savunan bir açıklama yaptı. Modelin geleneksel kıyaslama testlerinde çığır açmayacağını kabul eden Altman, “Bu farklı bir zeka türü ve daha önce hissetmediğim bir sihir var,” ifadelerini kullandı.
Ancak, sektördeki uzmanlar arasında GPT-4.5’in gerçekten yenilikçi olup olmadığı tartışılmaya devam ediyor. OpenAI’ın bir sonraki adımının ne olacağı merak konusu.