Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

WhatsApp’a gelecek yeni özellik belli oldu: Artık süreli olacak

WhatsApp, ‘Hakkında’ bölümü ile ilgili düğmeye bastı. Sosyal medya devine süreli durum özelliği geliyor.

Dev oyuncak firması ve ünlü TikTok kanalının savaşında büyük sürpriz

Bir oyuncak üreticisi, “Sylvanian Drama” isimli TikToker’a dava açmıştı. Ama şimdi bu davayı geri çektiği ortaya çıktı. Peki ama dava neden açılmıştı, ne oldu da geri çekildi?

Spotify üyeliklerine zam geldi

Dünyanın en büyük dijital müzik servislerinden biri olan Spotify, 2025 yılı Ağustos ayı itibariyle pek çok ülkede Premium abonelik fiyatlarını artırdı. Yapılan açıklamaya göre yeni fiyatlandırma Avrupa, Orta Doğu, Afrika, Asya-Pasifik ve Latin …

Türkiye’nin mesajlaşma uygulaması Next çıktı

Türkiye’nin mesajlaşma uygulaması olarak duyurulan ve yakın zaman önce çıkış yapan Next, iOS ve Android uygulama mağazalarında yer almaya başladı.

FuriosaAI, LG ile küresel oyundaki yerini aldı

Güney Kore merkezli yapay zekâ çipi girişimi FuriosaAI, LG AI Research ile büyük bir iş birliğine imza attı. Şirket, LG’nin kısa süre önce tanıttığı EXAONE 4.0 adlı yeni nesil hibrit yapay zekâ modeli için RNGD adlı çipini tedarik edecek. RNGD …

Steam aile paylaşımı nasıl yapılır? Adım adım yapılması gerekenler

Steam Aile Paylaşımı nasıl kurulur? Oyunlarınızı güvenle paylaşmak ve Aile Görünümü’nü etkinleştirmek için adım adım rehber burada!