Yapay Zeka Neden Saat Okuyup Takvim Hesaplamakta Başarısız?
Yapay zekalar kod yazıyor, şiir yazıyor, resim çiziyor ama klasik bir duvar saatine bakınca ne saat olduğunu anlayamıyorlar. Bunu fark ettiğinizde insan beyninin ne kadar etkileyici çalıştığını daha iyi kavrıyorsunuz. Çünkü insanlar küçük yaşlarda bu becerileri edinirken, yapay zeka halen çırak seviyesinde. Takvim yapraklarında gün bulmak ya da saatin kaç olduğunu söylemek, bizim için gündelik ama onlar için hala karmaşık bir iş. Yeni araştırmalar da bu şaşırtıcı zayıflığı net şekilde ortaya koydu.
En zeki yapay zekalar bile saat ve tarih işlerinde neden bu kadar başarısız?

2025 Uluslararası Öğrenme Temsilleri Konferansı’nda sunulan araştırmaya göre, GPT-4o, Gemini 2.0, Claude 3.5 Sonnet ve LLaMA 3.2 Vision gibi en gelişmiş yapay zekalar, analog saatleri doğru okuma konusunda oldukça kötü performans gösterdi.
Araştırmacılar, bu sistemlere çeşitli saat görselleri ve takvim örnekleri sundu. Sonuçlar şaşırtıcıydı; yapay zekalar, saatleri yalnızca %38.7 oranında doğru okuyabildi. Takvim hesaplamalarında ise bu oran %26.3'e kadar düştü.
Saat okumak, yapay zekalar için neden bu kadar karmaşık?

Edinburgh Üniversitesi'nden araştırmacı Rohit Saxena’ya göre problem aslında çok temel bir bilişsel farktan kaynaklanıyor. İnsanlar saat okurken açıları hesaplar, akrep ve yelkovanı ayırt eder, bazı durumlarda Romen rakamlarını yorumlar.
Yani işin içinde uzamsal düşünme, bağlamsal yorum ve matematiksel muhakeme var. Ancak yapay zekalar çoğunlukla örüntü tanıma üzerine çalışıyor. Onlar için 'bu bir saat' demek kolay ama 'saat kaç?' sorusunu cevaplamak ayrı bir beceri gerektiriyor.
Takvim hesaplamaları neden sorun yaratıyor?

153. gün haftanın hangi gününe denk geliyor gibi sorular, temel matematik gibi görünse de yapay zekalar için öyle değil. Çünkü büyük dil modelleri, tıpkı saat okumada olduğu gibi matematiksel işlemlerle değil, önceki örneklerden tahmin yürüterek cevap veriyor.
Bu nedenle verilen bir tarihi doğru güne denk getirmede sık sık hataya düşüyorlar. Araştırmacılar, hatta artık çok temel konular gibi görünen artık yıllar ya da büyük yıllık takvim formatlarında bile yüksek hata oranları gözlemlediklerini belirtiyor.
Saat kurmak, randevu planlamak veya hatırlatma ayarlamak gibi gündelik işler, zaman kavramını doğru anlamayı gerektiriyor. Eğer bu alanda halen ciddi zaafları varsa günlük hayatta sorunsuz çalışmaları mümkün değil. Saxena, eksikliği gidermek için yapay zekaların daha fazla örnekle eğitilmesi ve uzamsal-akıl yürütme yetilerinin geliştirilmesi gerektiğini vurguluyor.
Keşfet ile ziyaret ettiğin tüm kategorileri tek akışta gör!
Yorum Yazın
https://copilot.microsoft.com her seferinde doğru cevap verdi.
"saat kaç" diye mi sordun?
😝😃😀😄😂😆🤣😁😛😝