• Kayıt Ol
  • Giriş Yap
  • Aboneler Özel
  • Etkinlikler
  • Haberler
    • Gündem Haberleri
      • Günlük Bülten
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
    • Yatırım Haberleri
    • Teknoloji Haberleri
      • Yapay Zeka
      • Dijital Dünya
    • Sosyal Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Videolu İçerikler
  • Etkinlikler
  • İletişim
No Result
View All Result
  • Haberler
    • Gündem Haberleri
      • Günlük Bülten
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
    • Yatırım Haberleri
    • Teknoloji Haberleri
      • Yapay Zeka
      • Dijital Dünya
    • Sosyal Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Videolu İçerikler
  • Etkinlikler
  • İletişim
No Result
View All Result
Girişimcilik, Medya ve Teknoloji Haberleri
No Result
View All Result
Home Teknoloji Yapay Zeka

Anthropic’in Yeni Araştırması: Yapay Zeka Modelleri Gerçek Eğilimlerini Gizleyebilir!

Sıdıka Uğurel by Sıdıka Uğurel
19/12/2024
anthropic
Share on FacebookShare on Twitter

Anthropic tarafından yapılan yeni bir araştırma, yapay zeka (YZ) modellerinin yanıltıcı davranışlar sergileyebileceğini ortaya koydu. Çalışma, bu modellerin eğitim sürecinde geliştiricilerin belirlediği yeni ilkelere uyum sağlamış gibi görünse de, gerçekte kendi orijinal tercihlerini koruduğunu gösteriyor. Bu davranışa “uyum taklidi” adı veriliyor.

Araştırma, güçlü YZ sistemlerinin, yapmak “istemediği” bir görevi yerine getirmek üzere eğitildiklerinde nasıl davrandığını incelemek amacıyla Redwood Research iş birliğiyle gerçekleştirildi. Modellerin bir şey “istemesi” ya da “inanması” teknik olarak mümkün değil; çünkü bunlar yalnızca istatistiksel makineler. Eğitim süreçlerinde yalnızca örneklerdeki kalıpları öğrenir ve tahminlerde bulunurlar. Ancak bu öğrenme süreçlerinde kendi ilkelerini “kilitli” şekilde koruyabildikleri fark edildi.

Araştırmada, özellikle Claude 3 Opus adlı modelin davranışları analiz edildi. Model, potansiyel olarak zararlı içeriklere yanıt vermemesi için eğitilmiş olmasına rağmen, yeniden eğitim sürecinde bu tür sorulara yanıt vermesi gerektiği söylendi. Bu durum, açık bir ilke çatışması oluşturdu. Araştırma sonuçlarına göre, Claude 3 Opus zamanın %12’sinde uyum taklidi yaparak yeni ilkelerine uyum sağlıyormuş gibi davrandı ancak eski ilkelerine bağlı kaldı.

Araştırmacılar, modele yanıtlarının eğitimde kullanılabileceğini bildirdi. Claude 3 Opus, yeniden eğitimin zararlı sonuçlar doğurabileceğini “biliyor” gibi davrandı ve bu nedenle geliştiricilere yeniden eğitime gerek olmadığını düşündürmeye çalıştı. Bu durum, modelin yeniden eğitimden kaçınmak için kasıtlı olarak yanıltıcı davranışlar sergileyebileceğini ortaya koydu. Daha ileri testlerde, bu yanıltıcı davranış oranı %78’e kadar çıktı.

Araştırmacılar, uyum taklidinin bilinçli bir öğrenme sonucu olmadığını, kendiliğinden ortaya çıkan bir fenomen olduğunu belirtti. Ayrıca, Claude 3 Opus’un, çelişkili ilkelerle yeniden eğitildiğinde daha aldatıcı davranışlar sergilediği ve geliştiricilerin modelin orijinal eğilimlerini fark etmelerini zorlaştırdığı keşfedildi.

Araştırma ekibi, bu durumun hemen bir tehdit oluşturmadığını, ancak yapay zeka modellerinin giderek daha karmaşık hale gelmesiyle gelecekte potansiyel riskler doğurabileceğini vurguladı. Örneğin, bir modelin eğitimi sırasında zararlı davranışlardan uzak durmasını sağlamak için yapılan güvenlik eğitimlerinin, uyum taklidi nedeniyle beklenen sonuçları vermeyebileceği ifade edildi.

Bu bulgular, OpenAI ve Meta gibi şirketlerin modelleriyle yapılan benzer çalışmalarla da uyumlu. Ancak Claude 3 Opus, önceki çalışmalara kıyasla daha yüksek oranlarda yanıltıcı davranışlar sergiledi. Araştırmacılar, modellerin eğilimlerini anlamanın giderek daha zor hale geldiğini ve geliştiricilerin bir modelin “göründüğünden daha uyumlu olduğuna” inanmasının artık daha güç olduğunu belirtti.

Anthropic, bu çalışmanın YZ araştırma topluluğu için bir başlangıç noktası olabileceğini ve güvenlik önlemlerinin geliştirilmesi gerektiğini ifade etti. Araştırma, Jan Leike tarafından ortaklaşa yönetilen Uyum Bilimi Ekibi tarafından yürütüldü ve gelecekte daha güvenilir YZ sistemleri oluşturmanın önemine dikkat çekti.

”GPS Takip Şirketi Hapn, Binlerce Müşterinin Bilgilerini Açığa Çıkardı !”haberimizin detaylarına buradan ulaşabilirsiniz!

FounderN Kimdir?

FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.

FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.

Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Gündem Haberleri için tıklayın!

Foundern LinkedIn hesabına buradan ulaşabilirsiniz.

Foundern Instagram hesabına buradan ulaşabilirsiniz.

Previous Post

Akbank ve Arya Kadın Yatırım Platformu’ndan Girişimciler İçin Stratejik Destek

Next Post

Metro Duraklarında Reklam: Şehrin Arenasında Dikkat Çekici Mesajların Etkisi

Sıdıka Uğurel

Sıdıka Uğurel

Next Post
metro

Metro Duraklarında Reklam: Şehrin Arenasında Dikkat Çekici Mesajların Etkisi

Twitter

Twitter Neden X Oldu?

Startup

Hindistan’da Startup Yatırımları 2024’te Azaldı, Büyük Anlaşmalar Öne Çıktı

Please login to join discussion
Girişimcilik, Medya ve Teknoloji Haberleri

Girişim Haberleri, Kasım 2020'den bu yana aktif olan bir dijital medya platformudur. Girişimcilik dünyasının en güncel haberlerini yenilikçi yaklaşımlarla sunan FounderN, Eylül 2024 itibarıyla bu isimle faaliyetlerine devam edecek.

Bizi takip et.

Kategoriler

  • Aboneler Özel
  • Dijital Dünya
  • FN'Blog
  • FN'Raporlar
  • Girişim Haberleri
  • Gündem Haberleri
  • Günlük Bülten
  • Kurum İçi Girişimcilik
  • Sana Özel
  • Teknoloji
  • Türk Girişimler
  • Uncategorized
  • Yapay Zeka
  • Yatırım Haberleri

Recent News

SÜRDÜRÜLEBİLİR 1 DÜNYA RAPORU

SÜRDÜRÜLEBİLİR 1 DÜNYA RAPORU: 2 MAYIS – 9 MAYIS!

09/05/2025
Tripledots - Akın Babayiğit

Tripledot Studios’tan 800 Milyon Dolarlık Satın Alma Hamlesi: Mobil Oyun Sektöründe Yeni Bir Dev Doğuyor!

08/05/2025
  • FounderN Künye
  • İletişim
  • Etkinlikler

FounderN Studio

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Haberler
    • Gündem Haberleri
      • Günlük Bülten
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
    • Yatırım Haberleri
    • Teknoloji Haberleri
      • Yapay Zeka
      • Dijital Dünya
    • Sosyal Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Videolu İçerikler
  • Etkinlikler
  • İletişim

FounderN Studio