OpenAI, ChatGPT platformunda kullanıcılar adına çok çeşitli bilgisayar tabanlı görevleri yerine getirebilen genel amaçlı yeni bir yapay zeka aracını devreye alıyor. Şirket, bu yeni aracın kullanıcı takvimlerini otomatik olarak yönetebildiğini, düzenlenebilir sunumlar ve slaytlar oluşturabildiğini ve kod çalıştırabildiğini belirtiyor.
ChatGPT agent olarak adlandırılan bu araç, OpenAI’nin daha önceki ajan tabanlı sistemlerinden tanıdık yetenekleri bir araya getiriyor. Örneğin, Operator’un web sitelerinde gezinme yetisi ile Deep Research’ün araştırma raporu hazırlama kapasitesi bu yeni sistemde birleştirildi. Kullanıcılar, bu ajanla etkileşime doğal dilde ChatGPT’ye yazarak geçebilecek.
ChatGPT agent, Perşembe günü itibarıyla OpenAI’nin Pro, Plus ve Team abonelerine sunulmaya başlanacak. Aracı etkinleştirmek için kullanıcılar, ChatGPT araçlar menüsünden “agent mode” seçeneğini seçebilecek.
Bu hamle, ChatGPT’yi sadece bir sohbet botu olmaktan çıkarıp, kullanıcılar adına eyleme geçebilen bir yapay zeka ürününe dönüştürme çabasının en ileri adımı olarak görülüyor. Son yıllarda OpenAI, Google ve Perplexity gibi Silikon Vadisi şirketleri benzer AI ajanları geliştirmişti, ancak bu erken versiyonlar karmaşık görevlerde yetersiz kalmıştı.
Buna karşın OpenAI, yeni ChatGPT agent’ın önceki sürümlerine göre çok daha yetenekli olduğunu vurguluyor.
Yeni ajan, Gmail ve GitHub gibi uygulamaları bağlamayı sağlayan ChatGPT konektörlerine erişebiliyor. Bu sayede ajan, verilen komutlara uygun bilgileri bu platformlardan çekebiliyor. Ayrıca, terminal erişimi ve API kullanımı da destekleniyor.
OpenAI, yeni ajanla örneğin “dört kişilik Japon kahvaltısı planlamak ve alışverişini yapmak” veya “üç rakip analiz edip bir sunum hazırlamak” gibi çok adımlı, karmaşık görevlerin yapılabileceğini söylüyor. Bu görevler, ajanın siteleri taramasını, plan oluşturmasını ve araçlar kullanmasını gerektiriyor.
Performans Verileri
OpenAI’ye göre, ChatGPT agent modeli birçok kıyaslamada en iyi sonuçları veriyor:
- Humanity’s Last Exam testinde %41,6 başarı (pass@1) oranı elde ediyor. Bu oran, o3 ve o4-mini modellerinin neredeyse iki katı.
- FrontierMath testinde, araçlara erişimi olan bir senaryoda %27,4 başarı sağlıyor. Önceki en iyi skor olan o4-miniise sadece %6,3.
Güvenlik Önlemleri
Bu gelişmiş kapasite, beraberinde güvenlik risklerini de getiriyor. OpenAI, ChatGPT agent’ın geliştirilmesinde güvenliğe özel önem verildiğini vurguluyor. Çünkü bu araç, kötü niyetli kişilerin eline geçtiğinde daha tehlikeli olabilecek yeni yetenekler barındırıyor.
OpenAI’nin yayımladığı güvenlik raporuna göre, ChatGPT agent modeli; biyolojik ve kimyasal silahlar gibi alanlarda “yüksek yetenekli” olarak sınıflandırıldı. Bu sınıflandırma, modelin ciddi zarar potansiyeli taşıyan mevcut yolları güçlendirebilme kapasitesine sahip olduğunu ifade ediyor. Doğrudan bir kanıt olmasa da, şirket ihtiyatlı bir yaklaşım benimseyerek yeni güvenlik önlemleri aldı.
Bu önlemler arasında:
- Gerçek zamanlı izleme sistemi,
- Biyolojiyle ilgili içerikleri tanımlayan çift aşamalı denetleme mekanizması,
- ChatGPT’nin hafıza özelliğinin devre dışı bırakılması yer alıyor.
Özellikle hafıza özelliği, önceki sohbetlerden bilgi hatırlama kapasitesine sahipti. Ancak OpenAI, kötü niyetli kişilerin bu özelliği veri sızdırmak için kullanabileceğini öngörerek bu özelliği şimdilik devre dışı bıraktı.
Sonuç olarak, ChatGPT agent kulağa oldukça etkileyici gelse de, gerçek dünyadaki performansı zamanla test edilecek. Şu ana kadar AI ajanlarının dış dünyayla etkileşimde kırılgan olduğu görülmüştü. Ancak OpenAI, bu kez vaatlerini yerine getirecek kadar güçlü bir model geliştirdiğine inanıyor.
”Cursor, GitHub Copilot’a Rakip Olma Yolunda Koala’yı Satın Aldı!”haberimizin detaylarına buradan ulaşabilirsiniz!
FounderN Kimdir?
FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.
FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.
Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Gündem Haberleri için tıklayın!
FounderN LinkedIn hesabına buradan ulaşabilirsiniz.
FounderN Instagram hesabına buradan ulaşabilirsiniz.