Çinli teknoloji şirketi Alibaba, pazartesi günü Qwen3 adlı yeni yapay zekâ model ailesini duyurdu. Şirketin açıklamasına göre bu modeller, bazı alanlarda Google ve OpenAI’ın en gelişmiş modelleriyle yarışabiliyor, hatta bazı testlerde onları geride bırakabiliyor.
Qwen3 modelleri, Hugging Face ve GitHub platformlarında “açık” lisansla indirilebilir olacak ya da yakında indirilmeye sunulacak. Modellerin büyüklüğü 0.6 milyar parametreden 235 milyar parametreye kadar değişiyor. (Parametre sayısı, bir yapay zekâ modelinin problem çözme yeteneğini kabaca gösterir; genelde daha fazla parametre, daha yüksek performans anlamına gelir.)
Alibaba, bu modellerin “hibrit” yapıda olduğunu söylüyor. Yani model, karmaşık problemler üzerinde düşünerek çözüm üretebilirken; daha basit soruları ise hızlıca cevaplayabiliyor. Bu “düşünme yeteneği”, modelin kendini denetlemesini ve daha doğru cevaplar vermesini sağlıyor. Ancak bu, işlem süresini biraz uzatabiliyor.
Qwen ekibi bir blog yazısında şunları belirtti:
“Düşünme ve düşünmeme modlarını sorunsuzca entegre ettik. Bu sayede kullanıcılar, görev bazında düşünme süresi ayarlayabiliyor.”
Yani kullanıcı, modelin ne kadar “düşüneceğine” kendisi karar verebiliyor.
Bazı Qwen3 modellerinde “uzman karışımı” (Mixture of Experts – MoE) adı verilen bir yapı kullanılıyor. Bu yapı, gelen soruları alt görevlere bölerek her birini konuyla ilgili küçük uzman modellere yönlendiriyor. Bu da hem performansı artırıyor hem de işlem gücünü daha verimli kullanıyor.
Alibaba’ya göre Qwen3 modelleri tam 119 dili destekliyor ve 36 trilyon token (yani yaklaşık 27 trilyon kelimeye denk veri) ile eğitildi. Eğitim verileri arasında ders kitapları, soru-cevaplar, kod parçaları, yapay zekâ tarafından üretilmiş veriler ve daha fazlası bulunuyor.
Tüm bu gelişmeler, Qwen3’ü önceki versiyonu Qwen2’ye göre oldukça ileriye taşıdı. Qwen3 modelleri, her ne kadar OpenAI’nin en gelişmiş modelleri olan o3 ve o4-mini kadar “çığır açıcı” olmasa da, yine de oldukça güçlü sonuçlar veriyor.
Örneğin yazılım yarışmaları platformu Codeforces’ta, Qwen3 ailesinin en büyük modeli olan Qwen-3-235B-A22B, OpenAI’nin o3-mini ve Google’ın Gemini 2.5 Pro modellerini geride bıraktı. Ayrıca matematikte zorluk seviyesi yüksek AIME sınavında ve mantıksal akıl yürütme testi BFCL’de de o3-mini’yi geçti. Ancak bu model henüz halka açık olarak indirilemiyor.
En büyük halka açık Qwen3 modeli olan Qwen3-32B bile, Çinli yapay zekâ laboratuvarı DeepSeek’in R1 modeli gibi bazı önemli rakiplerinin önüne geçiyor. Bu model ayrıca OpenAI’nin o1 modelini de bazı testlerde geride bırakmış durumda. Örneğin yazılım geliştirme performansını ölçen LiveCodeBench testinde oldukça başarılı.
Alibaba, Qwen3’ün araç çağırma (tool-calling), talimatları anlama ve belirli formatlarda veri kopyalama konularında da çok iyi performans gösterdiğini belirtti. Qwen3 modelleri sadece indirilebilir olarak değil, Fireworks AI ve Hyperbolic gibi bulut sağlayıcılar üzerinden de erişilebilir durumda.
Bulut tabanlı yapay zekâ şirketi Baseten’in kurucu ortağı ve CEO’su Tuhin Srivastava, Qwen3’ün açık kaynak modellerin kapalı sistemlerle aynı seviyeye geldiğini gösterdiğini söylüyor.
“ABD, Çin’e yönelik çip satışlarını kısıtlamaya devam etse de, Qwen3 gibi açık ve ileri seviye modellerin Çin içinde yaygın olarak kullanılacağı açık.”
”OpenAI, ChatGPT’ye Alışveriş Dönemi Başlatıyor!”haberimizin detaylarına buradan ulaşabilirsiniz!
FounderN Kimdir?
FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.
FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.
Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Gündem Haberleri için tıklayın!
Foundern LinkedIn hesabına buradan ulaşabilirsiniz.
Foundern Instagram hesabına buradan ulaşabilirsiniz.