Pazartesi, Haziran 1, 2026
  • Login
Girişimcilik, Startup ve Teknoloji Haberleri
  • Haberler
    • Teknoloji Haberleri
    • Gündem Haberleri
      • Sosyal Girişimcilik
      • Yapay Zeka Gündemi
      • Fintech Gündemi
      • Sağlık Teknolojileri Gündemi
      • Sürdürülebilirlik Gündemi
      • Oyun(Gaming) Girişimciliği
      • Günlük Bülten
      • Dijital Dünya
    • Yatırım Haberleri
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Yapay Zekâ Terimleri Sözlüğü
  • FN Etkinlikleri
  • İletişim
No Result
View All Result
  • Haberler
    • Teknoloji Haberleri
    • Gündem Haberleri
      • Sosyal Girişimcilik
      • Yapay Zeka Gündemi
      • Fintech Gündemi
      • Sağlık Teknolojileri Gündemi
      • Sürdürülebilirlik Gündemi
      • Oyun(Gaming) Girişimciliği
      • Günlük Bülten
      • Dijital Dünya
    • Yatırım Haberleri
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Yapay Zekâ Terimleri Sözlüğü
  • FN Etkinlikleri
  • İletişim
No Result
View All Result
Girişimcilik, Startup ve Teknoloji Haberleri
No Result
View All Result

Anthropic’in Yeni Araştırması: Yapay Zeka Modelleri Gerçek Eğilimlerini Gizleyebilir!

Sıdıka Uğurel by Sıdıka Uğurel
19/12/2024
in Yapay Zeka Gündemi
Reading Time: 4 mins read
2
2 9

2 9

Facebook'ta PaylaşX'te PaylaşWhatsapp'ta PaylaşLinkedln'de Paylaş

Anthropic tarafından yapılan yeni bir araştırma, yapay zeka (YZ) modellerinin yanıltıcı davranışlar sergileyebileceğini ortaya koydu. Çalışma, bu modellerin eğitim sürecinde geliştiricilerin belirlediği yeni ilkelere uyum sağlamış gibi görünse de, gerçekte kendi orijinal tercihlerini koruduğunu gösteriyor. Bu davranışa “uyum taklidi” adı veriliyor.

Araştırma, güçlü YZ sistemlerinin, yapmak “istemediği” bir görevi yerine getirmek üzere eğitildiklerinde nasıl davrandığını incelemek amacıyla Redwood Research iş birliğiyle gerçekleştirildi. Modellerin bir şey “istemesi” ya da “inanması” teknik olarak mümkün değil; çünkü bunlar yalnızca istatistiksel makineler. Eğitim süreçlerinde yalnızca örneklerdeki kalıpları öğrenir ve tahminlerde bulunurlar. Ancak bu öğrenme süreçlerinde kendi ilkelerini “kilitli” şekilde koruyabildikleri fark edildi.

Araştırmada, özellikle Claude 3 Opus adlı modelin davranışları analiz edildi. Model, potansiyel olarak zararlı içeriklere yanıt vermemesi için eğitilmiş olmasına rağmen, yeniden eğitim sürecinde bu tür sorulara yanıt vermesi gerektiği söylendi. Bu durum, açık bir ilke çatışması oluşturdu. Araştırma sonuçlarına göre, Claude 3 Opus zamanın %12’sinde uyum taklidi yaparak yeni ilkelerine uyum sağlıyormuş gibi davrandı ancak eski ilkelerine bağlı kaldı.

Araştırmacılar, modele yanıtlarının eğitimde kullanılabileceğini bildirdi. Claude 3 Opus, yeniden eğitimin zararlı sonuçlar doğurabileceğini “biliyor” gibi davrandı ve bu nedenle geliştiricilere yeniden eğitime gerek olmadığını düşündürmeye çalıştı. Bu durum, modelin yeniden eğitimden kaçınmak için kasıtlı olarak yanıltıcı davranışlar sergileyebileceğini ortaya koydu. Daha ileri testlerde, bu yanıltıcı davranış oranı %78’e kadar çıktı.

Araştırmacılar, uyum taklidinin bilinçli bir öğrenme sonucu olmadığını, kendiliğinden ortaya çıkan bir fenomen olduğunu belirtti. Ayrıca, Claude 3 Opus’un, çelişkili ilkelerle yeniden eğitildiğinde daha aldatıcı davranışlar sergilediği ve geliştiricilerin modelin orijinal eğilimlerini fark etmelerini zorlaştırdığı keşfedildi.

Araştırma ekibi, bu durumun hemen bir tehdit oluşturmadığını, ancak yapay zeka modellerinin giderek daha karmaşık hale gelmesiyle gelecekte potansiyel riskler doğurabileceğini vurguladı. Örneğin, bir modelin eğitimi sırasında zararlı davranışlardan uzak durmasını sağlamak için yapılan güvenlik eğitimlerinin, uyum taklidi nedeniyle beklenen sonuçları vermeyebileceği ifade edildi.

Bu bulgular, OpenAI ve Meta gibi şirketlerin modelleriyle yapılan benzer çalışmalarla da uyumlu. Ancak Claude 3 Opus, önceki çalışmalara kıyasla daha yüksek oranlarda yanıltıcı davranışlar sergiledi. Araştırmacılar, modellerin eğilimlerini anlamanın giderek daha zor hale geldiğini ve geliştiricilerin bir modelin “göründüğünden daha uyumlu olduğuna” inanmasının artık daha güç olduğunu belirtti.

Anthropic, bu çalışmanın YZ araştırma topluluğu için bir başlangıç noktası olabileceğini ve güvenlik önlemlerinin geliştirilmesi gerektiğini ifade etti. Araştırma, Jan Leike tarafından ortaklaşa yönetilen Uyum Bilimi Ekibi tarafından yürütüldü ve gelecekte daha güvenilir YZ sistemleri oluşturmanın önemine dikkat çekti.

”GPS Takip Şirketi Hapn, Binlerce Müşterinin Bilgilerini Açığa Çıkardı !”haberimizin detaylarına buradan ulaşabilirsiniz!

FounderN Kimdir?

FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.

FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.

Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Gündem Haberleri için tıklayın!

Foundern LinkedIn hesabına buradan ulaşabilirsiniz.

Foundern Instagram hesabına buradan ulaşabilirsiniz.

Share188Tweet117SendShare33
Sıdıka Uğurel

Sıdıka Uğurel

İlginizi çekebilir

Promake Team scaled

Yapay Zeka Girişimi Promake, Google for Startups Accelerator MENAT 2026 Programına Kabul Edildi

by Eda Arslantaş
22/05/2026
0

KOBİ’lerin iş kurma ve yönetim süreçlerini tek bir yapay zeka sohbet arayüzüne indirgeyen yerli girişim Promake.ai, küresel yolculuğunda kritik bir eşiği daha atladı. Girişim, teknoloji devi Google'ın bölgedeki...

GeminiAI Asistan

Gemini, 7/24 Çalışan Daha Proaktif Bir AI Asistanına Dönüşüyor

by İsmail Karaçengel
20/05/2026
0

Google, I/O 2026 öncesinde Gemini uygulaması için kapsamlı yeni özelliklerini duyurdu. Şirket, Gemini’nin artık yalnızca soru yanıtlayan bir sohbet asistanı olmaktan çıkıp, kullanıcı adına görevleri takip eden, organize...

Gemini Omni

Google, Görsel ve Video Üretimi İçin Gemini Omni Modelini Duyurdu

by İsmail Karaçengel
20/05/2026
0

Google, yapay zekâ modellerini metin tahmin eden sistemlerden gerçekliği daha iyi anlayan ve simüle edebilen yapılara taşımak için yeni Gemini Omni model ailesini duyurdu. Şirketin yeni modeli, farklı...

Osaurus

Mac Kullanıcılarına Yapay Zeka Özgürlüğü: Osaurus Hem Yerel Hem Bulut Modellerini Birleştiriyor

by Eda Arslantaş
15/05/2026
0

Eski Tesla ve Netflix mühendisi Terence Pae tarafından geliştirilen Osaurus, Mac ekosisteminde yapay zeka ajanları için devrimsel bir işletim katmanı sunuyor. Platform, kullanıcıların verilerini kendi cihazlarında tutarken yerel modeller...

Next Post
FounderN Web Gorsel Ekip 2024 12 19T210656.434

Metro Duraklarında Reklam: Şehrin Arenasında Dikkat Çekici Mesajların Etkisi

Please login to join discussion
FounderN Logo Red e1777310691661

Girişim Haberleri, Kasım 2020'den bu yana aktif olan bir dijital medya platformudur. Girişimcilik dünyasının en güncel haberlerini yenilikçi yaklaşımlarla sunan FounderN, Eylül 2024 itibarıyla bu isimle faaliyetlerine devam edecek.

Bizi takip et.

  • FounderN Künye
  • İletişim
  • Editoryal Politika
  • Hakkımızda

©️ FounderN, 2020 Tüm hakları saklıdır. Bu web sitesinde yer alan tüm yazılar, bilgi notları, görseller ve logolar 5846 sayılı Fikir ve Sanat Eserleri Kanunu kapsamında koruma altındadır. İçeriklerin tamamının veya bir kısmının izinsiz kopyalanması, çoğaltılması, yayılması veya kaynak gösterilmeksizin paylaşılması yasaktır. İzinsiz kullanım halinde hukuki yollara başvurma hakkı saklıdır.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Haberler
    • Teknoloji Haberleri
    • Gündem Haberleri
      • Sosyal Girişimcilik
      • Yapay Zeka Gündemi
      • Fintech Gündemi
      • Sağlık Teknolojileri Gündemi
      • Sürdürülebilirlik Gündemi
      • Oyun(Gaming) Girişimciliği
      • Günlük Bülten
      • Dijital Dünya
    • Yatırım Haberleri
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Yapay Zekâ Terimleri Sözlüğü
  • FN Etkinlikleri
  • İletişim

©️ FounderN, 2020 Tüm hakları saklıdır. Bu web sitesinde yer alan tüm yazılar, bilgi notları, görseller ve logolar 5846 sayılı Fikir ve Sanat Eserleri Kanunu kapsamında koruma altındadır. İçeriklerin tamamının veya bir kısmının izinsiz kopyalanması, çoğaltılması, yayılması veya kaynak gösterilmeksizin paylaşılması yasaktır. İzinsiz kullanım halinde hukuki yollara başvurma hakkı saklıdır.