
OpenAI CEO’su Sam Altman, bu yıla bir blog yazısında, 2025’in AI ajanları için büyük bir yıl olacağını , görevleri otomatikleştirebilen ve sizin adınıza eylemlerde bulunabilen araçlar olacağını söyleyerek başladı.
Şimdi OpenAI’ın ilk gerçek denemesini görüyoruz.
OpenAI, Perşembe günü, bir web tarayıcısının kontrolünü ele geçirebilen ve belirli eylemleri bağımsız olarak gerçekleştirebilen genel amaçlı bir yapay zeka aracı olan Operator’ın araştırma önizlemesini başlattığını duyurdu.
Operatör ilk olarak ChatGPT’nin 200$ Pro abonelik planındaki ABD kullanıcılarına geliyor . OpenAI, bu özelliği sonunda Plus, Team ve Enterprise katmanlarındaki daha fazla kullanıcıya sunmayı planladığını söylüyor.
Bu ilk araştırma önizlemesi şu anda operator.chatgpt.com adresinden erişilebilir durumda, ancak OpenAI yakında Operator’ı tüm ChatGPT istemcilerine entegre etmek istediğini söylüyor.
OpenAI’ye göre Operatör, seyahat konaklama rezervasyonu, restoran rezervasyonu ve çevrimiçi alışveriş gibi görevleri otomatikleştirmeyi vaat ediyor. Kullanıcıların Operatör arayüzünde alışveriş, teslimat, yemek ve seyahat dahil olmak üzere seçebilecekleri çeşitli görev kategorileri var ve bunların hepsi farklı otomasyon türlerini mümkün kılıyor.
ChatGPT kullanıcıları Operator’ı etkinleştirdiğinde, ajanın görevleri tamamlamak için kullandığı özel bir web tarayıcısını gösteren küçük bir pencere açılır ve ajanın ne yaptığını açıklayan bir metin görüntülenir. Kullanıcılar, Operator çalışırken ekranlarının kontrolünü ele geçirmeye devam edebilir.
OpenAI, Operator’ın şirketin GPT-4o modelinin görme yeteneklerini OpenAI’nin daha gelişmiş modellerinin akıl yürütme yetenekleriyle birleştiren bilgisayar kullanan aracı veya CUA tarafından desteklendiğini söylüyor. CUA, web sitelerinin ön yüzüyle etkileşime girecek şekilde eğitilmiştir, yani farklı hizmetlere erişmek için geliştiriciye yönelik API’leri kullanması gerekmez.
Başka bir deyişle, CUA tıpkı bir insan gibi düğmeleri kullanabilir, menülerde gezinebilir ve bir web sayfasındaki formları doldurabilir.
“CUA modeli, örneğin bir sipariş göndermeden, bir e-posta göndermeden önce, harici yan etkileri olan görevleri sonlandırmadan önce kullanıcıdan onay istemek üzere eğitilmiştir, böylece kullanıcı modelin çalışmasını kalıcı hale gelmeden önce iki kez kontrol edebilir,” diye yazıyor OpenAI TechCrunch’a sağlanan materyallerde. “[Bu] çeşitli durumlarda zaten yararlı olduğunu kanıtladı ve bu güvenilirliği daha geniş bir görev yelpazesine yaymayı hedefliyoruz.”
OpenAI, Operatörün bu işletmelerin normlarına saygı göstermesini sağlamak için DoorDash, Instacart, Priceline, StubHub ve Uber gibi şirketlerle iş birliği yaptığını söylüyor.
Ancak OpenAI, CUA’nın mükemmel olmadığı konusunda uyarıyor. Şirket, “CUA’nın şu anda tüm senaryolarda güvenilir bir performans göstermesini beklemediğini” söylüyor.
Aşırı tedbir amacıyla OpenAI, bankacılık işlemleri, CUA ve Operatör gibi bazı görevler için de denetim gerektiriyor ve bu görevleri tamamen kendi başlarına gerçekleştirebiliyorlar.
OpenAI materyallerinde, “E-posta gibi özellikle hassas web sitelerinde, Operatör aktif kullanıcı denetimi gerektirir ve kullanıcıların modelin yapabileceği olası hataları doğrudan yakalayıp düzeltebilmelerini sağlar,” diyor.
Operator, OpenAI’nin bir AI aracısı yaratma konusunda şimdiye kadarki en cesur girişimi gibi görünüyor. Geçtiğimiz hafta OpenAI , ChatGPT’ye hatırlatıcılar ayarlama ve her gün belirli bir saatte çalışacak istemleri zamanlama gibi basit otomasyon özellikleri sağlayan Tasks’ı yayınladı. Tasks, ChatGPT kullanıcılarına ChatGPT’yi Siri veya Alexa kadar kullanışlı hale getirmek için bazı tanıdık ancak gerekli özellikler verdi. Ancak Operator, önceki nesil sanal asistanların asla yapamayacağı yetenekleri gösteriyor.
Yapay Zeka ajanları, ChatGPT’den sonra yapay zekanın bir sonraki büyük olayı olarak tanıtıldı: insanların interneti ve bilgisayarlarını nasıl kullandıklarını değiştirecek yeni bir teknoloji. Sadece bilgi iletmek ve işlemek yerine, ajanlar teoride eylemlerde bulunabilir ve bir şeyler yapabilir. OpenAI ilk somut yaklaşımını yayınladığında, bu vizyonun ne kadar gerçekçi olduğu yakında netleşecek.