Google’ın yeni yapay zekası tarayıcıyı insan gibi kullanabiliyor

Google, web tarayıcısını insan gibi kullanabilen yeni Gemini 2.5 Computer Use modelini tanıttı. Bu yapay zeka, API erişimi olmayan verileri elde etmek için tıpkı bir kullanıcı gibi tarayıcıda tıklayabiliyor, kaydırma yapabiliyor ve metin girebiliyor.

Gemini 2.5 Computer Use, görsel anlama ve mantıksal çıkarım yeteneklerini kullanarak kullanıcıdan aldığı komutları analiz ediyor ve görevi adım adım yerine getiriyor. Örneğin, bir form doldurabiliyor veya bir web sitesinde belirli bir işlemi tamamlayabiliyor. Google, bu özelliğin kullanıcı arayüzü testlerinde veya API bağlantısı bulunmayan servislerde gezinmek için özellikle yararlı olduğunu belirtiyor.

Google’a göre rakiplerinden iyi

Şirketin daha önce benzer teknolojileri, Gemini’nin “AI Mode” özelliğinde ve Project Mariner adlı deneysel tarayıcı projesinde test edilmişti. Mariner, yapay zekanın bir alışveriş listesine göre sepete ürün eklemesi gibi işlemleri kendi başına gerçekleştirebilen bir sistem olarak dikkat çekmişti.

[twitter=https://www.youtube.com/watch?v=slOLc1nkKY0]

Google, yeni modelin çok sayıda web ve mobil benchmark testinde rakiplerinden daha yüksek performans gösterdiğini vurguluyor. OpenAI’ın yeni “ChatGPT Agent” sistemi kullanıcı adına karmaşık görevleri tamamlayabiliyorken, Anthropic de geçtiğimiz yıl Claude modelinin “computer use” yeteneğini tanıtmıştı.

Öte yandan Gemini 2.5 Computer Use, şu anda yalnızca web tarayıcısına erişebiliyor. Yani sistem düzeyinde bir bilgisayar kontrolü söz konusu değil. Model, şu anda 13 farklı eylemi destekliyor. Bu eylemler arasında tarayıcı açmak, metin yazmak, sürükle-bırak işlemleri yapmak ve sayfada gezinmek yer alıyor.

Gemini 2.5 Computer Use, şu anda Google AI Studio ve Vertex AI platformları üzerinden geliştiricilere sunuluyor. Ayrıca Browserbase üzerinde herkese açık bir demo da bulunuyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir